一个使用类型来构建自然语言界面的库。
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。
微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
一个开源的深度伪造工具包,用于生成逼真的深度伪造视频和图像。
一个语音转换工具,可以将文字转换为语音,并用OSC消息发送到VRChat上的头像显示。
一个实验性的开源项目,使用本地大模型与数据和环境进行交互,数据100%安全。
一个收集免费API的共享列表,包含各种各样的免费API,供开发者使用。这些API可以用于开发各种应用程序、网站和软件,为开发者提供了丰富的功能和数据源。
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本
能够在几分钟内生成专业的人物头像
一个使用类型来构建自然语言界面的库。