一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务
可以爬取指定网站中的内容,并生成json文件,可以直接上传到GPTs的知识库使用。
一个为黑白图像上色的魔搭模型,通过双解码器实现逼真的图像着色,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。
一个公共的GitHub代码库,用于在GPU或CPU上从任何地方运行具有gradio用户界面的Llama 2
通过参考图片,使用文本生成图像,风格符合参考图像
一种分层自适应零样本语音风格转换模型
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务