2025年最强大的9个微调AI工具推荐 | AI-magic

微调

CodeTF-一站式代码类LLM工具库

CodeTF-一站式代码类LLM工具库

CodeTF是Salesforce出品的一站式代码类LLM工具库，提供了一套统一的接口用于Code LLM的训练、推导和微调，支持多种模型，易于扩展和集成。

代码LLM工具库代码推导微调机器学习集成

Dolomite Engine-超优化的大型语言模型训练库

Dolomite Engine-超优化的大型语言模型训练库

Dolomite Engine是一款用于预训练和微调大型语言模型的超优化库，集成了多项关键创新，包括模型架构、微调方法和系统优化。它旨在提高大型语言模型的训练效率和效果，支持多种模型架构，优化微调过程，并提供系统性能的显著提升。

大型语言模型训练库微调系统性能优化预训练

MosaicML-专注于模型训练与微调的公司

MosaicML是一家专注于模型训练和微调的公司，发布了一系列新的大型语言模型(LLM)，其中包括专为故事创作设计的模型，旨在支持文学创作和儿童教育。

互动式学习儿童教育微调故事创作

OpenVLA-开源视觉-语言-动作模型

OpenVLA-开源视觉-语言-动作模型

OpenVLA是一个开源的视觉-语言-动作模型，旨在通过高效微调的方式支持多机器人控制，结合了先进的语言和视觉编码技术，能够在多种任务中表现出色，适用于广泛的机器人应用场景。

DINOv2Llama 2PyTorch训练SigLIP

peft_pretraining-参数高效的语言模型预训练

peft_pretraining-参数高效的语言模型预训练

是参数高效的语言模型微调中最受欢迎的方法之一。该项目探讨了以参数高效的方式进行语言模型的预训练，并引入了一种名为ReLoRA的方法，利用低秩更新来训练高秩网络。

ReLoRATransformer预训练低秩更新参数高效语言模型

Megatron-LLM-支持大规模分布式语言模型预训练和微调的库

Megatron-LLM-支持大规模分布式语言模型预训练和微调的库

Megatron-LLM是一个专为大规模分布式训练设计的库，旨在高效支持语言模型的预训练和微调。它提供灵活的模型架构配置，并支持多种优化算法，使得用户可以根据需求进行优化和扩展，同时易于与其他深度学习框架集成。

大规模分布式训练微调深度学习框架集成语言模型预训练

Byzer-LLM-全生命周期的 LLM 解决方案

Byzer-LLM-全生命周期的 LLM 解决方案

基于 Ray 的 LLM 全生命周期解决方案，包括预训练、微调、部署和服务，支持 Python/SQL API，基于 Ray，易于扩展

LLM解决方案Python APIRay架构SQL API

ChatLM-mini-Chinese-中文对话的小型生成模型

ChatLM-mini-Chinese-中文对话的小型生成模型

ChatLM-mini-Chinese是一个中文对话0.2B小模型，旨在整理生成式语言模型的训练流程，包括数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等。

tokenizer训练中文对话生成模型微调数据清洗

Terracotta-快速直观的LLM实验平台

Terracotta是一个平台，使用户能够快速直观地实验大型语言模型（LLMs），支持模型管理、微调和评估。用户可以安全存储数据，针对分类和文本生成微调模型，并进行定性与定量比较。

LLM实验平台微调数据存储模型管理

Promptic-轻量级LLM应用开发框架

Promptic-轻量级LLM应用开发框架

一个轻量级LLM应用开发框架，类似于Python requests库的简洁设计理念，提供了90%必需的LLM开发功能。

LLM开发流程简化对话式AI功能跨平台兼容轻量级LLM应用开发框架

LlamaIndex-灵活的数据框架

LlamaIndex是一个简单灵活的数据框架，用于将自定义数据源连接到大型语言模型(LLMs)。它提供业界领先的文档导入、解析、检索、索引、查询和评估能力。开发者可以使用Python和Typescript快速构建LLM应用程序。

LlamaIndexLLM应用程序数据框架数据检索与索引

Galactica-探索机器学习模型的交互平台

Galactica是一个提供用户友好界面的机器学习模型互动网站，用户可以输入数据或使用平台提供的示例数据，实验不同参数并观察模型的输出或预测。

AI驱动的数据分析机器学习模型互动平台用户友好的交互界面自定义数据输入

Token.js-集成多种语言模型的TypeScript SDK

Token.js-集成多种语言模型的TypeScript SDK

Token.js是一个集成了200多个大型语言模型（LLM）的TypeScript SDK，采用OpenAI格式，支持在客户端运行，无需代理服务器，且为免费开源项目，得到了社区的广泛支持。

OpenAI格式支持TypeScript SDK免费开源项目多语言模型集成

Awesome-AI-Agents-自主AI代理的综合解决方案

Awesome-AI-Agents-自主AI代理的综合解决方案

由LLM驱动的自主Agent集合，涵盖任务解决、多智能体协作、社会模拟等项目，提供框架、基准评估和相关资源，推动AI代理技术的发展

AI代理技术LLM应用多智能体协作社会模拟

AI Docs-自动化多种任务的LLM平台

AI Docs是一个平台，允许用户塑造和训练多个语言学习模型（LLM），以自动化各种任务。这些模型可以导出为API、Telegram机器人或WhatsApp机器人。用户可以使用提供的工具和资源创建和训练自己的LLM，指定所需功能并相应地训练模型。一旦训练完成，LLM可以被导出并集成到不同的应用程序或平台中。

API导出LLM平台数据分析聊天机器人

nat.dev-开源LLM测试平台

nat.dev是一个开源的LLM（语言模型）测试平台，提供用户友好的界面，方便用户实验不同的LLM模型并分析其性能。用户可以创建账户，选择不同的模型进行测试，输入文本提示，生成响应，并评估生成的输出。该平台还允许用户自定义模型参数，适合高级用户进行微调。

LLM模型性能分析开源LLM测试平台文本提示生成模型参数自定义

Featherless-无服务器的语言模型平台

Featherless是一个平台，提供对Hugging Face最新语言模型的访问，用户可以在无需租用GPU的情况下进行文本生成应用。用户只需订阅该无服务器平台，选择所需的LLM模型，即可开始生成文本，适用于各种应用场景。

Hugging Face模型访问文本生成应用无服务器语言模型平台

AutoGen UI-支持多代理开发LLM应用的框架

AutoGen UI-支持多代理开发LLM应用的框架

AutoGen UI是一个支持使用多个代理来开发大型语言模型（LLM）应用的框架。这些代理能够相互对话，以协同解决复杂任务，极大地简化了LLM应用的开发流程，同时具有强大的可扩展性和用户友好的Web界面。

LLM应用开发复杂任务解决方案多代理开发框架用户友好的Web界面

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3