UI-TARS是一款能像人类一样与图形界面交互的Agent模型,通过视觉感知、推理和行动能力,自动完成各种任务,包括在电脑、手机或网页上操作软件,而无需人工编写规则。同时,它集成了所有关键组件,实现端到端任务自动化,支持本地和云端部署。