AI开源项目

NVIDIA Cosmos Tokenizer-高效的图像和视频神经tokenizer

NVIDIA Cosmos Tokenizer 是一个高效的图像和视频神经 tokenizer 套件,它提高了视觉 tokenization 的状态艺术,并为大型自回归变换器(如 LLMs)或扩散生成器的可扩展、健壮和高...

NVIDIA Cosmos Tokenizer 是一个高效的图像和视频神经 tokenizer 套件,它提高了视觉 tokenization 的状态艺术,并为大型自回归变换器(如 LLMs)或扩散生成器的可扩展、健壮和高效开发铺平了道路。
NVIDIA Cosmos Tokenizer的特点:
1. 支持图像和视频的神经 tokenization
2. 提高视觉 tokenization 的效率
3. 为大型自回归变换器和扩散生成器提供支持
4. 可扩展且健壮的设计

NVIDIA Cosmos Tokenizer的功能:
1. 在图像处理任务中使用 tokenizer 将图像转换为 token
2. 在视频分析中提取视频帧的视觉特征
3. 与大型自回归模型配合进行训练和推理
4. 用于生成模型的输入数据预处理

相关推荐

暂无评论

暂无评论...