Ad Auris是一个让你在Spotify、Apple Podcasts和Google Podcasts上创建文章播放列表的工具
这是一个OpenAI的Whisper项目网站,该项目可以将语音或视频翻译成文本,并进行语言翻译。
YouTube Transcript offers a simple way to extract text from YouTube videos.
Musenet (OpenAI)是一个基于深度神经网络的生成模型,可生成长度为4分钟,包含10种不同乐器和多种风格的音乐作品。该模型使用了类似于GPT-2的无监督学习方法,通过学习预测数十万个MIDI文件中的下一个标记,从而发现了和声、节奏和风格的模式。
实时背景噪音消除工具,提升语音和视频通话质量
Pop2Piano是一个通过音频输入生成流行歌曲钢琴曲的项目。该项目是由Jongho Choi和Kyogu Lee开发的。官方库存储在GitHub上,用户可以在其中找到论文、演示视频和样本数据集。样本以立体声音频形式提供,钢琴伴奏在一侧,原唱在另一侧。该项目的GitHub页面包括关于项目及其进展的信息。
AI文本到语音生成器