![](https://cdn.msbd123.com/ad/ad.png)
Kokoro 82M 是一个高质量的 TTS 模型,能够生成极高音频质量的语音,同时模型大小不到 300M,便于部署和使用。该模型在 T4 上能够快速生成语音,并支持通过架构训练其他语言,且只需不到 100 小时的音频数据进行训练。
Kokoro 82M的特点:
1. 生成音频质量高
2. 模型大小小于 300M
3. 在 T4 上快速生成语音
4. 支持通过架构训练其他语言
5. 仅需不到 100 小时的音频数据进行训练
Kokoro 82M的功能:
1. 生成英文语音
2. 训练其他语言的 TTS 模型
3. 进行语音合成和文本转语音的应用
4. 在 Hugging Face 平台上进行模型演示
相关导航
暂无评论...