该项目演示了如何让 GPT-4V 来控制自己的电脑,通过简单的指令完成各种任务。该系统使用领域特定语言(DSL)与机器进行交互,支持点击、输入和搜索等基本动作,每次执行操作时会携带任务目标、上一步执行结果以及屏幕截图作为上下文,具有高定制化程度的提示设计,非常适合处理复杂任务。