自动为视频生成高亮字幕
一个开源工具包,可实现语音、声音和歌唱功能
一个将稳定扩散模型引入Web浏览器的项目
PhotoMaker:利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
用户提供一张自己的全身照,就可以获得自己穿上对应服装的样子
一个开源的 Chatbot 管理服务,可以在管理台中创建基于 Prompt 还是 Embedding 的 Chat 服务,Embedding 可以支持 PDF 和网页文档
一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个开源工具包,可实现语音、声音和歌唱功能