一种分层自适应零样本语音风格转换模型
chatgpt_academic 的功能非常强大,能够一键完成各类复杂任务,包括一键润色论文、一键代码解释、自动生成总结汇报等等
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一个用于图像和视频修复的应用程序,它使用ESRGAN模型进行训练,该模型使用合成数据进行图像和视频的恢复
一个使用类型来构建自然语言界面的库。
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。
微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
一个开源的深度伪造工具包,用于生成逼真的深度伪造视频和图像。
一个语音转换工具,可以将文字转换为语音,并用OSC消息发送到VRChat上的头像显示。
一种分层自适应零样本语音风格转换模型