i2vgen-xl是一个最新的开源视频生成模型,基于先进的深度学习技术,能够支持高质量视频生成,并且开放源代码,便于用户自定义和扩展。该模型可以处理多种输入格式,适用于多种应用场景。
Allegro是一个新的开源视频生成模型,能够支持多种内容的创建,包括人类和动物的特写镜头,以及各种动态场景。该模型可以生成720x1280分辨率、15 FPS的详细6秒视频,并支持使用EMA-VFI技术将帧率提高到30 FPS。Allegro具有175M参数的VideoVAE和2.8B参数的VideoDiT模型,能够在BF16模式下使用9.3 GB的显存,且上下文长度达到79.2k,相当于88帧。