腾讯AI实验室推出的 AI 绘图模型,效果类似 ControlNet,可以控制图片生成的效果
一个使用类型来构建自然语言界面的库。
一个功能强大的视频处理工具,可满足用户在视频翻译、配音和编辑等方面的需求。
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。
一个本地的PDF处理工具,其界面为Web UI,支持Docker部署。
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
一个使用类型来构建自然语言界面的库。