一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个统一可控的视觉生成模型
一款功能强大的全自动AI直播系统,具备自动化、AI技术、直播管理、多平台支持和数据分析等特点
一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个扩展功能强大的面部替换工具
一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
一个统一可控的视觉生成模型