一个用于图像和视频修复的应用程序,它使用ESRGAN模型进行训练,该模型使用合成数据进行图像和视频的恢复
一个开源的2D和3D深度人脸分析库
专门用于生成 SQL 语句的模型
一个实现了在个人电脑上运行 LLM 模型,并集成了服务接口和在线聊天界面的项目。
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
1,100 多种语言推出语音转文本、文本转语音等功能,语音转文本的错误率只有 Whisper 的一半
全文本搜索引擎库
一个开源的2D和3D深度人脸分析库