Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
金融领域的大语言模型
通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
一个轻量级的 JavaScript(没有依赖项),为 SVG 设置动画,使它们看起来像是被绘制的
识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
借助大语言模型(LLM)处理音频的工具
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
基于浏览器的前端Web界面,支持本地或远程AI模型,用于搭建辅助写作、类AI Dungeon游戏、聊天机器人。
允许开发者通过一个简单的API接口来访问超过100种不同的大语言模型。包括OpenAI、Anthropic、Mistral、LLama2、Anyscale、Google Gemini等。
一个由Dabble开发的开源软件包,它可以帮助用户构建虚拟的产品摄影工作室。
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。