OpenVoice是一种多功能的语音克隆方法,只需要参考说话者的一个简短的音频片段即可复制他们的声音并生成多种语言的语音。
Fish Speech 1.4 是一个经过 700K 小时语音训练的开源文本转语音模型,支持多种语言,并提供即时语音克隆,具备超低延迟,约1GB的模型重量,模型权重可在Hub上获取。
ElevenLabs 是一款提供最具吸引力、丰富和逼真的语音的文本转语音和语音克隆软件,旨在为创作者和出版商提供讲故事的终极工具。
VoiceLingo是一款iOS应用,允许用户将自己的声音转换为多种语言的音频。用户只需录音并选择目标语言,应用便会生成相应的音频输出,方便进行语言学习和交流。
Voicv是一个先进的语音克隆平台,可以将声音转化为数字资产,支持多种语言,旨在快速和伦理地使用。用户只需录制10到30秒的声音,AI便能克隆出相应的声音供多种应用使用。
XTTS是一个强大的声音克隆项目,用户只需提供几秒钟的音频样本,即可创造出高质量的AI语音克隆。该项目具备出色的零样本克隆能力,并且支持多种语言,能够生成更加自然的语调和表达力。
Vana允许用户利用自己的数据和AI技术创建一个迷你的虚拟自我。用户可以克隆自己的声音、生成自拍,并了解他们的数据所传达的信息。Vana还支持将虚拟自我应用于个性化游戏、模拟体验和AI助手工具。
一个基于深度学习的中文语音合成项目,通过采集分析一段具体的声音样本,可在 5 秒内生成与之类似的克隆语音。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型