一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
一个开源工具包,可实现语音、声音和歌唱功能
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个封装的非常好的ChatGPT nodejs库
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
免魔法使用搭载联网GPT4的NewBing
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。