一个轻量级的视觉-语言-动作模型,专门用于GUI智能代理。它可以理解屏幕界面内容,执行点击、输入、滚动等交互操作,支持网页和手机应用场景,能够自动完成用户界面任务
这个项目是一个文献库,专注于汇总与图形用户界面(GUI)智能代理相关的研究论文,旨在为研究人员和开发者提供便捷的参考和引用。该资源库定期更新,以确保包含最新的研究成果,并支持多种文献引用格式,方便用户使用。