一款视频、音频和图像转换软件,基于FFmpeg和其他优秀工具设计,旨在尽可能方便和高效
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆
一种用于构建人工智能代理的反应式运行时
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
一个免费的、开源的 "Copilot for web",它允许你与网页进行自由对话或与其他用户进行自动争论
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆