该项目专注于使用先进的口语语言模型生成连贯的长篇语音,能够在多种应用场景中提供自然、流畅的语言输出。
Texttovoice.online 是一个免费的在线平台,利用人工智能技术将文本转换为英语语音。用户只需输入文本,选择语音选项,即可快速生成高质量的语音音频,适用于各种场景,如学习、演示和娱乐等。
Speechki是一个AI驱动的语音生成和文本转语音解决方案,用户可以通过它将任何文本转换为高质量的音频内容,支持1100多种声音和80多种语言。
这个开源项目是一个基于 OpenAI API 的对话引擎,它使用了官方 ChatGPT 模型实现。它可以通过 Joel GitHub 上的代码实现。
Revoicer是一款先进的AI文本转语音工具,能够生成富有情感的高质量配音,支持40多种语言,适用于各种数字媒体内容的制作。
Audio Strip是一款先进的AI工具,专为音频文件交互而设计,能够精准地从音轨中分离人声,提供高质量的无伴奏版本和伴奏曲目,适合音乐制作人、DJ及任何音频编辑爱好者。
VoiceCraft 是一个基于令牌填充的神经编解码语言模型,在野生数据集上的语音编辑和零样本文本到语音(TTS)转换方面达到了最先进的性能。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型