专为稳定人物视频抠像设计
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
基于私有LLM(大语言模型)做个人的文档问答
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本
一个使用ChatGPT4.0构建自己的AI女友的Python项目
一个语音转换工具,可以将文字转换为语音,并用OSC消息发送到VRChat上的头像显示。
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。