1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆
腾讯开源的AI模型GFPGAN,能帮助恢复老照片
Lepton Search是由贾扬清创办的Lepton AI应用构建平台开源的一个对话式AI搜素引擎
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
基于私有LLM(大语言模型)做个人的文档问答
一个开源的在线工具,可以生成各种设计感强、好玩有趣的二维码
支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆