Raspberry是一个旨在为微调具有推理能力的LLM创建开源玩具数据集的项目,特色在于通过合成复杂用户查询和自我批评数据来提升模型的推理能力。
大规模开源的遥感图像地质灾害点变化检测数据集,包含17对时变超高分辨率遥感图像,分辨率0.59m,采集自谷歌地球服务。总覆盖面积163.77平方公里,图像来自不同地理位置、时间、地表类型的地质灾害点,具有丰富的光谱异质性。
该存储库列出了应用于卫星和航空图像的深度学习主题的资源,同时涵盖经典机器学习技术、云计算和模型部署等主题。
一个用本地大型语言模型生成合成数据的Python库,提供灵活易用的接口,帮助用户创建由提示引导的数据集。用户可以根据自身需求定制数据集,适用于多种数据生成场景,提升数据科学工作流的效率。
Financial Datasets 是一个开源的 Python 库,旨在利用大语言模型(LLM)生成合成的金融和财务数据集,方便用户进行数据分析和机器学习模型训练。该库支持多种数据格式输出,并且易于与现有的数据分析工具集成。
2000 Hugging Face Prompts 是一份全面的资源,旨在帮助爱好者学习和实验 Hugging Face,使他们熟悉其在不同背景下的功能和应用。
AI to Data 是一个由人工智能驱动的数据生成器,允许用户为任何用例生成真实数据。它采用先进的AI技术生成可靠和安全的数据。用户只需注册或登录平台,提供自然语言查询以指定所需数据类型和行数,系统将生成请求的数据,用户可以以CSV文件格式下载。
剑桥法律语料库是一个专为法律领域的人工智能研究而设计的语料库,提供丰富的法律文本数据,支持法律领域的自然语言处理研究,适用于法律AI模型的训练和测试,包含多种法律文书和案例。
Densely Captioned Images (DCI) 数据集旨在为图像提供详细的描述,以捕捉视觉细节,适用于计算机视觉领域的多种任务。
Shield AI是一家专注于开发自主AI飞行员的前沿技术公司,其旗舰产品Hivemind能够在没有GPS、通信或人工干预的情况下自主操作无人机和飞机,主要应用于军事和商业航空,提供革命性的无人空中作战解决方案。