MiniMind-V是MiniMind纯语言模型的视觉能力拓展,包含VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。它是开源VLM模型的最小实现,也是入门视觉语言模型的简明教程。