一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
输入文本、视频、音频,生成带动作的虚拟角色。
一个使用GPT模型来控制浏览器的工具。它通过接受自然语言命令,实现了用人类方式与浏览器进行交互的功能。
一个封装的非常好的ChatGPT nodejs库
一个统一可控的视觉生成模型
使用 GPT-4 自动化您的浏览器 在插件中输入自然语言命令,你就可以操控浏览器,例如创建Google日历、搜索、播放视频。
Mac 上的一个多模态 AI 助手,能支持语音和截图,借助 GPT-4V 的多模态能力,可以基于当前屏幕截图和指令可以回复问题。
输入文本、视频、音频,生成带动作的虚拟角色。