所有AI工具AI视频工具

Latte-视频生成的潜扩散Transformer模型

Latte是一种新的潜扩散Transformer模型,用于视频生成,能够从输入视频中提取时空token,并通过Transformer块建模潜空间中的视频分布。该模型在多个标准视频生成数据集上取得了最...

标签:

Latte是一种新的潜扩散Transformer模型,用于视频生成,能够从输入视频中提取时空token,并通过Transformer块建模潜空间中的视频分布。该模型在多个标准视频生成数据集上取得了最先进的性能,支持文本到视频生成任务,适用于多种复杂的时空视频生成需求。
Latte的特点:
1. 能够生成高质量视频
2. 提取时空token以建模视频分布
3. 在多个标准视频生成数据集上实现最先进的性能
4. 支持文本到视频生成任务

Latte的功能:
1. 用于生成复杂的时空视频内容
2. 在研究和开发中用于视频生成模型的实验
3. 作为视频生成领域的基准模型进行比较

相关导航

暂无评论

暂无评论...