通过几笔简单的草图来控制扩散式图像生成的功能
通过语音和人脸图像来生成逼真的嘴唇运动
一键免费部署你的跨平台私人 ChatGPT 应用, 支持 GPT3, GPT4 & Gemini Pro 模型。(基于 LangChain 实现插件功能)
通过动画的形式展示了所有 LeetCode 上的问题的解题思路
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个具有高度定制化和隐私控制的聊天型人工智能,适用于各种规模的企业
通过语音和人脸图像来生成逼真的嘴唇运动