音频转文字
chatgpt_academic 的功能非常强大,能够一键完成各类复杂任务,包括一键润色论文、一键代码解释、自动生成总结汇报等等
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一个统一可控的视觉生成模型
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
通过几笔简单的草图来控制扩散式图像生成的功能
在文本输入的同时立即开始语音合成,无需等待整个文本输入完毕。
chatgpt_academic 的功能非常强大,能够一键完成各类复杂任务,包括一键润色论文、一键代码解释、自动生成总结汇报等等