AI开源项目

GPT-4V-Act-让AI控制浏览器,自动执行任务

这个项目演示了让 GPT-4V 来控制自己的浏览器,执行任务如随机播放音乐,自动进行输入、搜索、点击、选择等操作。

这个项目演示了让 GPT-4V 来控制自己的浏览器,执行任务如随机播放音乐,自动进行输入、搜索、点击、选择等操作。
GPT-4V-Act的特点:
1. 能够让 GPT-4V 控制浏览器执行各种任务
2. 通过对网页截图进行预处理(labeling)来提高理解准确性
3. 为网页元素增加边框和标号,便于精准操作
4. 支持复杂的用户交互,如搜索引擎操作

GPT-4V-Act的功能:
1. 通过输入特定指令让 GPT-4V 开始控制浏览器
2. 使用 label 操作提升 GPT-4V 对网页元素的理解
3. 执行任务如随机播放音乐或其他自动化任务

相关推荐

暂无评论

暂无评论...