视觉语言模型的Token压缩技术