AI开源项目

gen-cv-文本转语音头像项目

微软的文本转语音头像项目,允许用户通过文本输入创建会说话的头像视频,构建实时交互式机器人。

微软的文本转语音头像项目,允许用户通过文本输入创建会说话的头像视频,构建实时交互式机器人。
gen-cv的特点:
1. 支持生成2D逼真化身说话的合成视频
2. 基于人类视频录制样本的深度神经网络模型
3. 集成文本分析器、TTS音频合成器和TTS头像视频合成器
4. 可使用预构建或自定义头像
5. 适用于培训视频和演示视频等多种场景

gen-cv的功能:
1. 输入文本到文本分析器生成音素序列
2. 使用TTS音频合成器合成语音
3. 通过神经文本转语音Avatar模型生成唇同步图像
4. 创建富含交互式头像的应用程序

相关推荐

暂无评论

暂无评论...