一个开源工具包,可实现语音、声音和歌唱功能
专为稳定人物视频抠像设计
高级语音和Deepfake神经网络工具
Facebook Research开发的Audiocraft音频处理和生成库-用于音频处理和生成的深度学习库
一个使用ChatGPT4.0构建自己的AI女友的Python项目
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
专为稳定人物视频抠像设计