微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
一种分层自适应零样本语音风格转换模型
一个开源的深度伪造工具包,用于生成逼真的深度伪造视频和图像。
文档聊天机器人
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。