PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
一个功能强大的视频处理工具,可满足用户在视频翻译、配音和编辑等方面的需求。
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。
展示了开源语音AI在各种设备中的威力
基于 AI 的口语训练平台
马斯克旗下xAI推出的人工智能助手
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
一个功能强大的视频处理工具,可满足用户在视频翻译、配音和编辑等方面的需求。