基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成框架。
MuseV的特点:
1. 支持使用新颖的视觉条件并行去噪方案进行无限长度生成,避免误差累计问题,尤其适用于固定相机位的场景。
2. 提供基于人物类型数据集训练的虚拟人视频生成预训练模型。
3. 支持图像到视频、文本到图像到视频、视频到视频的生成。
4. 兼容 Stable Diffusion 文图生成生态系统,包括 base_model、lora、controlnet 等。
5. 支持多参考图像技术,包括 IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID。
6. 后续将推出训练代码。
MuseV的功能:
1. 可以用于生成虚拟人视频,适合影视、游戏等领域。
2. 用于研究和开发基于视觉条件的生成模型。
3. 用于创建增强现实或虚拟现实中的虚拟人内容。
4. 可以集成到其他 AI 应用程序中,进行视频生成。
相关推荐
暂无评论...