VisualThinker-R1-Zero是一个探索2B模型多模态“顿悟时刻”的项目,首次在2B非SFT模型上实现视觉推理的“顿悟时刻”。该项目显著增加了模型响应长度,大幅提升了推理能力,并观察到模型的自我反思行为,能够自动纠正错误。