2025年最强大的代码LLM工具库AI推荐

CodeTF是Salesforce出品的一站式代码类LLM工具库，提供了一套统一的接口用于Code LLM的训练、推导和微调，支持多种模型，易于扩展和集成。

在这篇论文中，研究人员修改了Chinchilla扩展定律，以计算最佳的LLM参数数量和预训练数据大小，以训练和部署具有给定质量和推理需求的模型。

Giskard是一个用于大规模检测和测试机器学习模型的工具，能够自动检测幻觉和偏见。它支持自托管和云部署，集成了多个平台，如🤗、MLFlow和W&B，适用于从表格模型到大型语言模型的各种应用。

Litellm是一个Python SDK/Proxy Server，旨在简化与多种大语言模型API的交互，支持使用OpenAI格式调用100多个LLM API，提供统一的输入输出格式，易于集成和使用。

旨在开发支持大规模并行训练的机器学习天气和气候模型的PyTorch框架，Makani 提供高效的计算资源利用，帮助研究人员进行气候变化研究和天气预测。

Milvus是一个开源的向量数据库，旨在支持生成性人工智能（GenAI）应用。它允许用户通过pip安装，能够进行高速搜索，并且在性能损失最小的情况下扩展到数百亿个向量。

Dolomite Engine是一款用于预训练和微调大型语言模型的超优化库，集成了多项关键创新，包括模型架构、微调方法和系统优化。它旨在提高大型语言模型的训练效率和效果，支持多种模型架构，优化微调过程，并提供系统性能的显著提升。

一种基于Llama-2模型使用自己数据微调的方法，A100显卡就可以对70B模型微调。

FlexGen: 针对面向吞吐量的场景在单个 GPU 上运行大型语言模型，旨在提高模型的运行效率和简化部署过程。

该项目汇总了与多模态大语言模型（LLM）相关的研究论文和资源，提供最新的研究趋势和进展，支持多种模态的学习方法，适用于学术研究和工程实践。

提供一种 Pythonic 方式在 LLM 管线上运行离线评估，以便轻松投入生产

JaxIRL是一个在JAX框架中实现的反向强化学习(IRL)算法，能够以极高的效率训练模型，支持多种算法，具有灵活性和可扩展性。