Raspberry是一个旨在为微调具有推理能力的LLM创建开源玩具数据集的项目,特色在于通过合成复杂用户查询和自我批评数据来提升模型的推理能力。
包含10万个压缩驾驶视频的数据集,用于机器学习研究,可用于GPT视频预测模型的实验,还包含编码器/解码器和视频预测模型示例
一个用于端到端架构和大语言模型(LLM)的项目,旨在简化和优化开发过程。
ULLME是一个统一的框架,旨在通过生成增强学习优化大型语言模型的嵌入,支持双向注意力机制以及多种微调策略,帮助提升模型的性能和效果。
WizardLM是一个基于Code Llama微调的模型,专注于代码生成和相关任务,支持多种编程语言的代码编写与理解,提供模型的测试地址和下载链接,经过简单测试表现良好。
Railroad-dataset是一个专为铁路应用设计的SLAM(同步定位与地图构建)数据集,包含丰富的定位与建图数据以及检测数据,旨在支持铁路环境相关的研究与开发。数据集中提供了高质量的传感器数据,适用于验证各种SLAM算法,并为研究者和开发者提供了一个可靠的实验平台。
Anyscale是一个统一的计算平台,旨在利用Ray简化可扩展AI和Python应用的开发、部署和管理。用户可以轻松地开始使用Anyscale端点进行服务和微调开源大型语言模型(LLMs)。
斯坦福开发的一种遵循指令的 LLaMA 模型,基于 Meta 的 LLaMA 7B 模型进行微调,性能接近 OpenAI 的 text-davinci-003,支持在单个 GPU 或 CPU 上运行。
IEPile是一个用于训练和评估信息提取模型的大规模信息提取语料库,提供高质量的标注数据,支持多种信息提取任务,适用于学术研究和工业应用。
Graduate-Level Google-Proof Q&A Benchmark,是一个评估大型语言模型和可扩展监督机制能力的高难度数据集,包含448道选择题,旨在测试专家的准确率。
Acquire AI是一个AI市场和平台,用户可以发现、购买、构建和出售创新且可扩展的AI项目。它为AI爱好者、开发者和企业提供了一个全面的生态系统,以便探索、获取和协作AI项目。
Densely Captioned Images (DCI) 数据集旨在为图像提供详细的描述,以捕捉视觉细节,适用于计算机视觉领域的多种任务。
VLABench是一个大规模基准测试平台,专为公平评估视觉语言代理、具身代理和视觉语言模型而设计,提供长视野推理任务的支持,适用于多种任务和场景,旨在为研究人员和开发者提供标准化的测试环境。