1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点
一个方便开发者使用的工具,它利用DeepL的免费服务,提供了一个本地API,让开发者可以轻松地集成到他们的项目中
通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
全文本搜索引擎
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点