一个基于飞桨(PaddlePaddle)的跨模态大模型开发套件,旨在聚合图像、文本、视频等多种模态,以支持各种跨模态任务
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
将屏幕截图转换为清洁的HTML / Tailwind / JS代码
一个方便实用的纯前端网站,能够在浏览器中快速生成仿真扫描的PDF文件。
一个使用类型来构建自然语言界面的库。
一个由Dabble开发的开源软件包,它可以帮助用户构建虚拟的产品摄影工作室。
大语言模型的视觉助手
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!