基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
一个封装的非常好的ChatGPT nodejs库
一款完全离线的OCR图片转文字识别软件,支持命令行、HTTP接口等多种调用方式,支持截图OCR / 批量OCR / 二维码 / 数学公式识别(测试中)
通过几笔简单的草图来控制扩散式图像生成的功能
一个强大的自动化视频制作工具,它可以自动采集素材、编辑视频、配音、生成字幕,从而简化了视频创建过程
一个方便实用的纯前端网站,能够在浏览器中快速生成仿真扫描的PDF文件。
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。