一个将稳定扩散模型引入Web浏览器的项目
借助大语言模型(LLM)处理音频的工具
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
DragGAN 是一个效果惊人的 AI 绘图工具,它让设计师和艺术家交互地、极其精细地调整 AI 绘图过程,和那些输入文本、期待 AI 生成作品、然后一次次痛苦地微调结果的 AI 相比,这领先了一个时代!
提供易于使用的界面,用于创建高质量的深度伪造视频
帮助你发现优秀中文项目,可以无语言障碍地、更高效地吸收优秀经验成果
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。
借助大语言模型(LLM)处理音频的工具