基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
一种分层自适应零样本语音风格转换模型
一个将稳定扩散模型引入Web浏览器的项目
轻松构建LLMs应用程序开源UI可视化工具
专为稳定人物视频抠像设计
针对GPT-4/GPT-3.5(OpenAI API)的开源桌面应用程序,支持Windows、Mac和Linux。
一个公共的代码存储库,主要用于BIliBili视频网站、抖音以及人工智能(AI)方面的虚拟主播项目
一种分层自适应零样本语音风格转换模型