mini_qwen开源项目 – 1B参数中英文大语言模型

mini_qwen是一个从头开始训练的1B参数的大型语言模型(LLM)项目，包括预训练(PT)、微调(SFT)和直接偏好优化(DPO)3个部分。该项目基于Qwen2.5-0.5B-Instruct模型，通过扩充模型隐藏状态层数、隐藏状态维度和注意力头数，增加参数量到1B，并进行参数随机初始化。支持中英文，预训练和微调仅需要12G显存，直接偏好优化仅需要14G显存。使用flash_attention_2进行加速，使用deepspeed在6张H800上进行训练，探究了尺度定律(scaling law)、复读机现象与微调阶段的知识注入。

mini_qwen的特点:

1. 1B参数，支持中英文，满足多样化需求
2. 预训练、微调、直接偏好优化三步走，训练流程清晰
3. 只需12G显存，就能在T4显卡上开启训练之旅
4. 详细教程与代码，新手也能轻松上手
5. 使用flash_attention_2进行加速
6. 使用deepspeed在6张H800上进行训练
7. 探究了尺度定律、复读机现象与微调阶段的知识注入

mini_qwen的功能:

1. 从零开始打造你的专属大语言模型
2. 在T4显卡上进行训练
3. 支持中英文的多样化需求
4. 通过预训练、微调、直接偏好优化三步走流程进行模型训练
5. 使用T4显卡进行预训练
6. 使用T4显卡进行微调
7. 使用T4显卡进行直接偏好优化
8. 详细记录整个训练过程，供学习和交流
9. 支持在6张H800上进行高效训练

相关导航

MiniMind开源项目 – 低成本快速训练超小语言模型

MiniMind 是一个开源 AI 项目，旨在从零开始，以极低的成本和极短的时间训练出超小语言模型。项目涵盖了从数据集清洗到模型训练的全过程，并提供了多种先进的算法和模型结构。MiniMind 通过原生 PyTorch 重构核心算法代码，不依赖第三方库的抽象接口，适合个人设备快速训练。项目还拓展了视觉多模态的 VLM: MiniMind-V，不仅是大语言模型的全阶段开源复现，也是一个入门 LLM 的教程。

DeepSeek R1开源项目 – 从零构建高效推理模型

DeepSeek R1 是一个从零开始构建的高效推理模型项目。它使用 Qwen 作为基础模型，通过 GRPO 算法进行初步训练，并结合 Supervised Fine-Tuning (SFT) 和改进的强化学习方法，显著提升了模型的推理能力和语言一致性。项目提供了全流程的代码实现、详细的训练过程描述和手绘流程图，使得即使是初学者也能轻松上手。

NBenchy开源项目 – AI性能对比工具

Benchy是一个让AI性能对比变得直观的工具，支持实时对比不同AI模型的性能、价格和速度。它提供多种微应用，以满足不同场景的测试需求，帮助用户快速评估和选择最适合的AI模型。

search_with_lepton开源项目 – 构建对话式搜索引擎，简单易用

使用不到 500 行代码构建对话式搜索引擎！实现了类似 Perplexity 的效果，完整的前后端代码，已在 GitHub 上开源，可商用。

Visual-Thinker开源项目 – 让大语言模型学会看图思考

Visual-Thinker 是一种新方法，旨在让大语言模型具备理解视觉信息的能力。通过纯文本描述迷宫等复杂场景，模型能够自主规划路径，并在遇到困难时学会“重启”。该方法通过GRPO优化显著提升了模型的性能，使其在路径规划等任务中表现优异。

ChatLM-mini-Chinese开源项目 – 中文对话的小型生成模型

ChatLM-mini-Chinese是一个中文对话0.2B小模型，旨在整理生成式语言模型的训练流程，包括数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等。

Pix2Text开源项目 – 高效的图像文本识别工具

Pix2Text 是一个用于将图像中的文本和数学公式转换为可编辑格式的工具，支持 80+ 种语言的识别，提供高精度的识别模型，优化了识别逻辑和输出格式，增强了用户体验。

Apollo开源项目 – 多语言医学自然语言处理项目

Apollo是一个多语言医学模型、数据集、基准和代码的开源项目，旨在为英语、中文、法语、印地语、西班牙语和阿拉伯语提供医学领域的自然语言处理能力。

Gameboy开源项目 – 全功能跨平台 GameBoy 模拟器

Gameboy 是用 Rust 开发的全功能跨平台 GameBoy 模拟器。目标已经在 Windows、Ubuntu 和 Mac 上进行了完全的测试。

Nllm-coder开源项目 – 本地AI生成网站代码

llm-coder是一款完全在本地运行的AI工具，旨在通过文字描述或拖拽图片的方式快速生成HTML和CSS代码。它无需API密钥或外部服务器支持，采用Apache-2.0开源许可，用户可以自由修改和分发代码，适合在本地环境中进行网站开发。

Hugging Face AI Agents 课程开源项目 – 免费AI代理课程

Hugging Face 推出的免费 AI Agents 课程，从基础入门到掌握如何使用和构建 AI 代理。课程涵盖理论、实践及流行框架，适合具备基础 Python 知识和 LLM 基础概念的学习者。课程内容包括 AI 代理的概念、设计与应用，以及如何使用 smolagents、LangChain、LlamaIndex 等主流库。完成作业可获得 Hugging Face 认证证书。

Byzer-LLM开源项目 – 全生命周期的 LLM 解决方案

基于 Ray 的 LLM 全生命周期解决方案，包括预训练、微调、部署和服务，支持 Python/SQL API，基于 Ray，易于扩展

Intel Extension for Transformers

Intel Extension for Transformers 是一个开源项目，旨在使客户端 CPU 上的大型语言模型（LLM）微调成为可能，特别是在没有 GPU 的情况下。它支持在 CPU 上进行 QLoRA 微调，适用于笔记本电脑环境，并通过优化的性能提升模型训练效率。该项目与 HuggingFace Transformers 兼容，支持 4 位推理，并利用 Intel 神经压缩器提供丰富的模型压缩技术，如量化、剪枝和蒸馏，显著提高了英特尔平台上的推理效率。此外，它还支持自动化的仅限权重的 INT4 量化流程，兼容多个流行的大语言模型，如 Llama2、Llama 和 GPT-NeoX。

NMoodist开源项目 – 专注放松的听觉网站

Moodist是一个有助于专注于放松的听觉网站，界面简洁颜值高，内置超过78种环境声音，用户可以自由选择和组合这些声音。该项目完全开源和免费，提供了多种功能，如睡眠计时器、便签功能和番茄时钟功能，帮助用户放松、集中注意力、改善睡眠质量、提高工作效率以及进行时间管理和任务规划。

ReliableGPT开源项目 – 确保OpenAI应用的可靠性和正常运行

ReliableGPT 是一款创新工具，旨在增强与 OpenAI 强大 GPT 模型集成的应用程序的可靠性和正常运行时间。它解决了速率限制、超时、API 和密钥错误等常见挑战，确保企业和开发者能够保持无缝操作。该工具特别适合那些严重依赖 OpenAI 服务进行自然语言处理、内容生成等任务的用户，提供了一个强大的解决方案，以确保服务平稳运行，避免中断。

暂无评论

暂无评论...