从音频到照片真实的体现:在对话中合成虚拟人物形象。该项目可以从多人对话中的语音生成与对话相对应的逼真面部表情、完整身体和手势动作。
audio2photoreal的特点:
1. 能够生成与对话相对应的逼真面部表情、身体和手势动作
2. 生成的虚拟人物具备高度真实感,能够准确反映对话中的手势和表情细节
3. 结合矢量量化样本多样性与扩散技术生成动态、表现力强的运动
4. 提供第一个多视图对话数据集,用于照片级真实感重建
audio2photoreal的功能:
1. 给定语音音频,生成个体手势运动的多种可能性
2. 使用生成的高度真实化身可视化手势运动
3. 在元宇宙和远程视频应用中用于合成虚拟人物形象
相关推荐
暂无评论...