一家主导稳定扩散模型的创意引擎公司,利用最新的人工智能技术,为专业人士、艺术家和爱好者提供生成和创建视觉媒体的能力
一个可以将自己的照片上传并生成数字孪生的应用程序
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个实现了在个人电脑上运行 LLM 模型,并集成了服务接口和在线聊天界面的项目。
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
一个扩展功能强大的面部替换工具
输入文本、视频、音频,生成带动作的虚拟角色。
一个可以将自己的照片上传并生成数字孪生的应用程序