Facebook Research开发的Audiocraft音频处理和生成库-用于音频处理和生成的深度学习库
声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
一个封装的非常好的ChatGPT nodejs库
一个开源AI个人助手,通过分析您的个人文本或图像数据来提供服务
输入文本、视频、音频,生成带动作的虚拟角色。
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
能够在几分钟内生成专业的人物头像
声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音