Browser-Use 是一个开源的网页自动化库,能够让大型语言模型(LLM)与网站进行互动,通过简单的接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理。它兼容任意 LLM,适用于多种浏览器的自动化操作,可用于数据抓取和信息检索。
flyscrape是一个用Go语言编写的网站爬虫,提供独立可定制的Web抓取功能,结合了Go语言的高效性能和JavaScript的灵活性,具有易于配置和稳定运行的优点,适合各种数据抓取需求。
Crawl4AI是一个简单易用且高效的网页爬虫开源工具,专为大型语言模型(LLM)设计,用于爬取并输出适合训练的数据格式,如Markdown、JSON和HTML等。它具备强大的反爬能力,支持多种媒体数据的提取,同时提供友好的API接口和自定义抓取规则,适合集成到机器学习工作流中。
zhihu-ai-qa项目汇集了超过1000个关于人工智能的热门问答,提供便捷的查询和获取接口,并支持多种分类和标签筛选,旨在高效抓取和存储相关数据。