Visual-Thinker 是一种新方法,旨在让大语言模型具备理解视觉信息的能力。通过纯文本描述迷宫等复杂场景,模型能够自主规划路径,并在遇到困难时学会“重启”。该方法通过GRPO优化显著提升了模型的性能,使其在路径规划等任务中表现优异。