该项目汇集了关于视觉Transformer(ViT)和视觉语言模型(VLM)的Token压缩技术的最新研究论文,旨在提高模型效率和性能。
该项目为用户提供与LLM(大语言模型)幻觉相关的研究论文列表,包含不同论文的摘要和关键点,方便用户进行导航和搜索,并定期更新最新的研究成果。
NVIDIA Cosmos Tokenizer 是一个高效的图像和视频神经 tokenizer 套件,它提高了视觉 tokenization 的状态艺术,并为大型自回归变换器(如 LLMs)或扩散生成器的可扩展、健壮和高效开发铺平了道路。
大型语言模型(LLM)幻觉相关论文列表,旨在解决大语言模型中的幻觉和真实性问题,通过评估、检测和改进方法提高语言模型的可靠性和正确性。
该项目专注于自动驾驶与智能交通系统中的视觉语言模型研究,涵盖了感知理解、导航规划、决策控制等多个领域,提供最新研究进展和相关论文,旨在推动该领域的发展和应用。