2025年最强大的监督微调AI工具推荐 | AI-magic

监督微调

MiniMind-V开源项目 – 极简视觉语言模型实现

NMiniMind-V开源项目 – 极简视觉语言模型实现

MiniMind-V是MiniMind纯语言模型的视觉能力拓展，包含VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。它是开源VLM模型的最小实现，也是入门视觉语言模型的简明教程。

多模态模型开源项目数据集清洗监督微调

DeepSeek R1开源项目 – 从零构建高效推理模型

DeepSeek R1开源项目 – 从零构建高效推理模型

DeepSeek R1 是一个从零开始构建的高效推理模型项目。它使用 Qwen 作为基础模型，通过 GRPO 算法进行初步训练，并结合 Supervised Fine-Tuning (SFT) 和改进的强化学习方法，显著提升了模型的推理能力和语言一致性。项目提供了全流程的代码实现、详细的训练过程描述和手绘流程图，使得即使是初学者也能轻松上手。

Deepseek R1GRPO算法从零构建推理模型开源项目

ScratchLLMStepByStep开源项目 – 从零开始编写大语言模型的教程

ScratchLLMStepByStep开源项目 – 从零开始编写大语言模型的教程

从零开始编写并训练大语言模型的教程，旨在为对语言模型和深度学习感兴趣的开发者提供系统的学习资源。

attention机制GPT模型transformer实现从零开始编写大语言模型

对齐手册开源项目 – 微调语言模型以符合人类和AI偏好

对齐手册开源项目 – 微调语言模型以符合人类和AI偏好

《对齐手册》主题是如何使用不同技术来微调语言模型，以使其更符合人类和AI的偏好。

人类和AI偏好奖励建模微调语言模型拒绝抽样

Xwin-LM开源项目 – 开源大型语言模型对齐技术

Xwin-LM开源项目 – 开源大型语言模型对齐技术

旨在开发并开源大型语言模型的对齐技术，包括监督微调(SFT)、奖励模型(RM)、拒绝采样和人类反馈强化学习(RLHF)等。

人类反馈强化学习大型语言模型对齐技术奖励模型监督微调

Petals官网 – 开源工具，协作运行大语言模型

Petals是一个开源工具，旨在通过团队协作运行大型语言模型。用户可以加载模型的一小部分，与其他人合作以提供模型的其他部分，从而实现推理或微调。

协作运行大型语言模型开源工具模型微调模型推理

Boss Copilot官网 – AI助手，助力LLM应用开发

Boss Copilot是一个基于AI的应用，作为您的助手，帮助创建大型语言模型应用。它使用多个代理相互协作，处理各种任务。用户只需安装Chrome扩展并启用即可，激活后可以提示AI代理执行工作流程、任务和代码，同时可以与ChatGPT沟通，利用GPT4的强大功能来完成项目。

AI助手ChatGPT集成Chrome扩展LLM应用开发

distilabel开源项目 – AI反馈框架，支持大规模LLM对齐

distilabel开源项目 – AI反馈框架，支持大规模LLM对齐

distilabel是一个用于构建和管理数据集的AI反馈框架，旨在通过使用大型语言模型（LLM）实现高效的标签对齐。该工具具有强大的可扩展性，适合处理大规模数据，并提供了用户友好的接口，方便用户进行数据标注和反馈收集。

AI反馈框架LLM标签对齐数据标注工具数据集构建

XVERSE-65B开源项目 – 支持多语言的650亿参数大模型

XVERSE-65B开源项目 – 支持多语言的650亿参数大模型

VERSE-65B 是由深圳元象科技自主研发的支持多语言的大语言模型，参数规模为 650 亿，开源的底座模型。

多语言大模型开源模型文本生成自然语言处理

Confident AI官网 – 全能的LLM评估平台

Confident AI是一个综合性的LLM评估平台，提供14种以上的指标来运行LLM实验，管理数据集，监控并整合人类反馈，以自动改进LLM应用。它与DeepEval协作，支持任何用例。

DeepEval兼容LLM评估平台人类反馈整合数据集管理

BELLE开源项目 – 中文优化的大语言模型项目

BELLE开源项目 – 中文优化的大语言模型项目

一个基于斯坦福的 Alpaca，并进行了中文优化的大语言模型项目，愿景是成为能够帮到每一个人的LLM Engine。

ChatGPT数据调优中文优化大语言模型开源预训练模型模型定制化

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3