2025年最强大的Proxy ServerAI工具推荐

Litellm-用于标准化多个大语言模型的简单库

Litellm是一个Python SDK/Proxy Server，旨在简化与多种大语言模型API的交互，支持使用OpenAI格式调用100多个LLM API，提供统一的输入输出格式，易于集成和使用。

0

LLM API标准化Proxy ServerPython SDK多模型交互

CodeTF-一站式代码类LLM工具库

CodeTF是Salesforce出品的一站式代码类LLM工具库，提供了一套统一的接口用于Code LLM的训练、推导和微调，支持多种模型，易于扩展和集成。

0

代码LLM工具库代码推导微调机器学习集成

magentic-无缝集成LLM为Python函数

magentic允许用户将大型语言模型（LLMs）集成到Python函数中，简化了LLM的调用与管理，提供易于使用的API，支持多种LLM模型，适合快速原型开发和测试。

0

LLM集成工具Python函数调用快速原型开发

Nrepo2file-整合Git文件，便捷使用LLM

将 Git 仓库中的选定文件整合到一个文件中，便于在大型语言模型（LLM）如 Claude 和 OpenAI 等中使用。该工具能够有效导出所需文件，支持多种语言模型，优化了文件处理的流程。

0

Git文件整合工具LLM文件处理命令行导出工具

Agora Protocol-高效沟通的跨平台协议

一个让不同大型语言模型（LLMs）高效沟通的跨平台协议，通过协商实现不同系统间的高效数据交换

0

AI应用集成大型语言模型互操作性数据交换机制跨平台协议

Preference Proxy Evaluations (PPE)-评估奖励模型与人类偏好的基准测试

一个用于评估奖励模型和LLM裁判的基准测试，帮助在大规模LLM训练和评估中复制人类偏好，包含真实的人类偏好数据和可验证的正确性偏好数据。

0

LLM训练人类偏好基准测试奖励模型评估

Langcorn-自动化部署LLM应用的API服务

用 LangChain + FastApi 部署自动化LLM应用，以便将 LangChain 应用作为 API 提供服务

0

API服务FastAPILangChainLLM模型集成

Void-AI驱动的开源代码工具

Void是cursor的一个开源替代，使用AI工具写代码，对数据有完全的控制，支持对接不同的LLM大模型，能够索引本地文件，变成AI搜索引擎。

0

AI搜索引擎AI驱动的代码编写LLM大模型对接开源代码工具

llm.mojo-Andrjey Karpathy最小化LLM代码的Mojo版

llm.mojo是Andrjey Karpathy将大型语言模型(LLM)最小化代码移植到Mojo编程语言的版本，旨在提供高效的模型推理和简化的学习体验。

0

LLM代码移植Mojo编程语言文本生成工具模型推理

openplayground-本地LLM模型试炼场

一个可以在笔记本电脑运行的LLM试炼场，支持来自多个机构的任意模型，包括OpenAI、Anthropic、Cohere、Forefront、HuggingFace、Aleph Alpha和llama.cpp等。

0

多模型支持快速原型开发本地LLM模型试炼场用户友好的界面

Ottic-高效的语言模型测试平台

Ottic是一个用于语言模型(LLM)产品的QA平台，旨在帮助技术和非技术团队高效测试基于LLM的应用程序。它提供了端到端的测试管理、全面的LLM评估和实时用户行为监控等功能。

0

LLM测试平台测试管理工具用户行为监控语言模型评估

Featherless-无服务器的语言模型平台

Featherless是一个平台，提供对Hugging Face最新语言模型的访问，用户可以在无需租用GPU的情况下进行文本生成应用。用户只需订阅该无服务器平台，选择所需的LLM模型，即可开始生成文本，适用于各种应用场景。

0

Hugging Face模型访问文本生成应用无服务器语言模型平台

co-mate-简化和优化LLM开发的项目

一个用于端到端架构和大语言模型（LLM）的项目，旨在简化和优化开发过程。

0

LLM开发工具多语言支持架构分析工具自定义部署

Falcon-40B-号称目前最强的开放式LLM

由TII（Technology Innovation Institute）构建的一个40B参数的因果解码器模型，训练在精选语料库增强的1000B tokens的RefinedWeb上。

0

Falcon-40B内容创作对话系统开放式LLM

FLASK-基于技能集的细粒度评估工具

FLASK是一个专注于基于技能集的细粒度评估工具，能够对大语言模型（LLM）进行全面分析和比较。它提供了评估模型在不同能力上的表现，并与最先进的开源LLM进行对比，帮助用户了解模型的优势和不足。

0

LLM性能评估基于技能集的评估工具开源LLM比较

miniLLMFlow-极简LLM框架，助力自我编程

miniLLMFlow是一个极简的LLM框架，仅用100行代码实现，旨在使大型语言模型能够进行自我编程。该框架提供了简洁易用的接口，并支持高效的模型训练和推理，适合研究和应用开发。

0

机器学习项目集成极简LLM框架模型推理模型训练

OpenCompass-一个高效的LLM评测平台

OpenCompass是一个大型语言模型评测平台，支持20多种模型和50多个数据集，能够通过高效的分布式评估技术进行快速全面的基准测试。

0

LLM评测平台分布式评估技术模型性能评估

StructuredRAG-评估大型语言模型的响应格式能力

StructuredRAG是一个用于评估大型语言模型（LLM）遵循响应格式指令能力的六个任务基准，旨在研究不同提示策略对模型性能的影响，并提供复杂任务的性能评估。该项目还包括开源实验代码和结果，方便研究人员进行进一步探索。

0

复杂任务性能评估开源实验代码提示策略研究评估大型语言模型