Litellm是一个Python SDK/Proxy Server,旨在简化与多种大语言模型API的交互,支持使用OpenAI格式调用100多个LLM API,提供统一的输入输出格式,易于集成和使用。
CodeTF是Salesforce出品的一站式代码类LLM工具库,提供了一套统一的接口用于Code LLM的训练、推导和微调,支持多种模型,易于扩展和集成。
magentic允许用户将大型语言模型(LLMs)集成到Python函数中,简化了LLM的调用与管理,提供易于使用的API,支持多种LLM模型,适合快速原型开发和测试。
将 Git 仓库中的选定文件整合到一个文件中,便于在大型语言模型(LLM)如 Claude 和 OpenAI 等中使用。该工具能够有效导出所需文件,支持多种语言模型,优化了文件处理的流程。
一个让不同大型语言模型(LLMs)高效沟通的跨平台协议,通过协商实现不同系统间的高效数据交换
一个用于评估奖励模型和LLM裁判的基准测试,帮助在大规模LLM训练和评估中复制人类偏好,包含真实的人类偏好数据和可验证的正确性偏好数据。
用 LangChain + FastApi 部署自动化LLM应用,以便将 LangChain 应用作为 API 提供服务
Void是cursor的一个开源替代,使用AI工具写代码,对数据有完全的控制,支持对接不同的LLM大模型,能够索引本地文件,变成AI搜索引擎。
llm.mojo是Andrjey Karpathy将大型语言模型(LLM)最小化代码移植到Mojo编程语言的版本,旨在提供高效的模型推理和简化的学习体验。
一个可以在笔记本电脑运行的LLM试炼场,支持来自多个机构的任意模型,包括OpenAI、Anthropic、Cohere、Forefront、HuggingFace、Aleph Alpha和llama.cpp等。
Ottic是一个用于语言模型(LLM)产品的QA平台,旨在帮助技术和非技术团队高效测试基于LLM的应用程序。它提供了端到端的测试管理、全面的LLM评估和实时用户行为监控等功能。
Featherless是一个平台,提供对Hugging Face最新语言模型的访问,用户可以在无需租用GPU的情况下进行文本生成应用。用户只需订阅该无服务器平台,选择所需的LLM模型,即可开始生成文本,适用于各种应用场景。
一个用于端到端架构和大语言模型(LLM)的项目,旨在简化和优化开发过程。
由TII(Technology Innovation Institute)构建的一个40B参数的因果解码器模型,训练在精选语料库增强的1000B tokens的RefinedWeb上。
FLASK是一个专注于基于技能集的细粒度评估工具,能够对大语言模型(LLM)进行全面分析和比较。它提供了评估模型在不同能力上的表现,并与最先进的开源LLM进行对比,帮助用户了解模型的优势和不足。
miniLLMFlow是一个极简的LLM框架,仅用100行代码实现,旨在使大型语言模型能够进行自我编程。该框架提供了简洁易用的接口,并支持高效的模型训练和推理,适合研究和应用开发。
OpenCompass是一个大型语言模型评测平台,支持20多种模型和50多个数据集,能够通过高效的分布式评估技术进行快速全面的基准测试。
StructuredRAG是一个用于评估大型语言模型(LLM)遵循响应格式指令能力的六个任务基准,旨在研究不同提示策略对模型性能的影响,并提供复杂任务的性能评估。该项目还包括开源实验代码和结果,方便研究人员进行进一步探索。