由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
通过语音和人脸图像来生成逼真的嘴唇运动
一款免费开源的漫画生成器,采用LLM和SDXL技术,用户只需输入提示词即可生成类似漫画风格的图片
一款应用程序,一次提问向多个大模型AI机器人聊天(包括ChatGPT,bing,Bard,文心,讯飞,360 智脑等)
自动音乐生成研究的演示网站列表
一个公共的代码存储库,主要用于BIliBili视频网站、抖音以及人工智能(AI)方面的虚拟主播项目
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
通过语音和人脸图像来生成逼真的嘴唇运动