支持文字生成视频和图片生成视频。
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
腾讯AI实验室推出的 AI 绘图模型,效果类似 ControlNet,可以控制图片生成的效果
为用户提供可在电脑端和手机端使用的嵌入工具。这些工具能够帮助用户创建、训练和部署机器学习模型,以解决各种实际问题
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
一个开源的2D和3D深度人脸分析库
一个开源的 Chatbot 管理服务,可以在管理台中创建基于 Prompt 还是 Embedding 的 Chat 服务,Embedding 可以支持 PDF 和网页文档
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半