AI开源项目

GPT-SoVITS-中文语音克隆,1分钟可训练TTS模型

GPT-SoVITS 是一个适用于中文的语音克隆项目,能够通过短时间的语音数据训练出高质量的文本到语音(TTS)模型。仅需1分钟的语音数据即可进行有效的模型微调,支持多语言推理,并提...

GPT-SoVITS 是一个适用于中文的语音克隆项目,能够通过短时间的语音数据训练出高质量的文本到语音(TTS)模型。仅需1分钟的语音数据即可进行有效的模型微调,支持多语言推理,并提供易于使用的Web界面,适合初学者创建和管理训练数据集。
GPT-SoVITS的特点:
1. 零样本 TTS:输入 5 秒语音样本并体验即时文本到语音转换。
2. Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
3. 跨语言支持:用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
4. WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。

GPT-SoVITS的功能:
1. 使用5秒音频样本进行零样本文本到语音转换。
2. 使用1分钟的音频数据微调模型以克隆自己的声音。
3. 在不同语言间进行推理,支持英语、日语和中文。
4. 通过WebUI工具创建和管理训练数据集。

相关推荐

暂无评论

暂无评论...