一款使用生成AI技术来存储和检索非结构化信息的“第二大脑”
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
输入文字即可编辑视频,包括修改风格、修改局部画面、视频混合、视频扩展。
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
一个方便实用的纯前端网站,能够在浏览器中快速生成仿真扫描的PDF文件。
基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!