EscherNet是一种可扩展的新型视图合成生成模型,无需3D结构,支持任何参考到任何目标新视图。该模型能够在单个消费级GPU上同时生成100多个一致的目标视图,处理任意数量的参考视图和任意相机姿势,建立在现有的2D扩散模型之上,继承强大的网络规模先验,并为每个视图/图像编码相机姿势,提供灵活性和可扩展性。
EscherNet的特点:
1. 支持在单个消费级 GPU 上同时生成 100 多个一致的目标视图
2. 能够处理任意数量的参考视图和任意相机姿势
3. 建立在现有的 2D 扩散模型之上,继承强大的网络规模先验
4. 为每个视图/图像编码相机姿势,提供灵活性和可扩展性
EscherNet的功能:
1. 生成任意到任意视图的合成
2. 通过输入多个参考视图生成新的视图
3. 在CVPR 2024会议上展示生成模型的应用
相关推荐
暂无评论...