帮助你发现优秀中文项目,可以无语言障碍地、更高效地吸收优秀经验成果
借助大语言模型(LLM)处理音频的工具
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。
一个用于PC流媒体或视频通话的实时人脸替换工具
音频转文字
一个可以将自己的照片上传并生成数字孪生的应用程序
全文本搜索引擎库
借助大语言模型(LLM)处理音频的工具