一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
轻松构建LLMs应用程序开源UI可视化工具
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
一种专门为实时图像生成服务设计的扩散模型管道,显著地提升了实时图像生成的性能。
一个开源、可扩展的高性能聊天机器人框架,支持一键部署私有ChatGPT/LLM Web应用程序
通过动画的形式展示了所有 LeetCode 上的问题的解题思路
一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频