由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
一个开源AI个人助手,通过分析您的个人文本或图像数据来提供服务
一个用于PC流媒体或视频通话的实时人脸替换工具
Facebook Research开发的Audiocraft音频处理和生成库-用于音频处理和生成的深度学习库
一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
一个开源AI个人助手,通过分析您的个人文本或图像数据来提供服务