一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个由Dabble开发的开源软件包,它可以帮助用户构建虚拟的产品摄影工作室。
一种专门为实时图像生成服务设计的扩散模型管道,显著地提升了实时图像生成的性能。
根据用户给出的提示构建代码
一个用于PC流媒体或视频通话的实时人脸替换工具
微软发布了DragNUWA 1.5版本,用户可以在图像上画出对应方向的箭头标记。在通过图像生成视频之前,这些标记可以用来指导镜头的运动方向。
识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
一个由Dabble开发的开源软件包,它可以帮助用户构建虚拟的产品摄影工作室。