数据抓取

Browser-Use 是一个开源的网页自动化库，能够让大型语言模型（LLM）与网站进行互动，通过简单的接口实现网页自动化操作，支持多标签管理、XPath提取和视觉模型处理。它兼容任意 LLM，适用于多种浏览器的自动化操作，可用于数据抓取和信息检索。

flyscrape是一个用Go语言编写的网站爬虫，提供独立可定制的Web抓取功能，结合了Go语言的高效性能和JavaScript的灵活性，具有易于配置和稳定运行的优点，适合各种数据抓取需求。

Go语言数据抓取论文复现

Crawl4AI是一个简单易用且高效的网页爬虫开源工具，专为大型语言模型(LLM)设计，用于爬取并输出适合训练的数据格式，如Markdown、JSON和HTML等。它具备强大的反爬能力，支持多种媒体数据的提取，同时提供友好的API接口和自定义抓取规则，适合集成到机器学习工作流中。

zhihu-ai-qa项目汇集了超过1000个关于人工智能的热门问答，提供便捷的查询和获取接口，并支持多种分类和标签筛选，旨在高效抓取和存储相关数据。

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。