一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一家主导稳定扩散模型的创意引擎公司,利用最新的人工智能技术,为专业人士、艺术家和爱好者提供生成和创建视觉媒体的能力
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个基于隐式空间的图像超分辨率算法,图像超分辨率任务的目标是将低分辨率图像转换为对应的高分辨率图像
专为稳定人物视频抠像设计
个在安卓平台上运行的UiAutomator,它可以用于自动化测试和操作安卓设备
从照片到 3D 头像
一家主导稳定扩散模型的创意引擎公司,利用最新的人工智能技术,为专业人士、艺术家和爱好者提供生成和创建视觉媒体的能力