Everlyn-1是首个开源的自回归基础视频AI模型,为视频生成和多模态理解带来突破。它通过创新性地引入Wasserstein距离优化矢量量化,显著提升了训练稳定性和性能。同时,其提出的EfficientARV框架能够高效生成图像和视频,支持多种生成任务。此外,ANTRP技术有效减少多模态大语言模型中的幻觉现象,进一步提升生成质量。