Linear-MoE开源项目 – 高效训练大型语言模型的混合专家库

Linear-MoE 是一个基于 Megatron-Core 的线性混合专家模型库，专注于为高效训练和部署大型语言模型提供强大支持。它集成了多种线性注意力机制，支持多种模型架构，并具备高效的分布式训练能力，助力大规模模型开发。此外，Linear-MoE 还提供了丰富的预训练和微调脚本，极大地简化了开发流程。

Linear-MoE的特点:

1. 集成多种线性注意力机制，支持多种模型架构
2. 高效的分布式训练能力，助力大规模模型开发
3. 提供丰富的预训练和微调脚本，简化开发流程

Linear-MoE的功能:

1. 用于高效训练大型语言模型
2. 支持多种模型架构的开发和部署
3. 简化预训练和微调流程，提升开发效率

相关导航

ToolBenc开源项目 – 高质量指令调优数据项目

清华大学构建的开源、大规模、高质量的指令调优数据项目，旨在帮助开发者构建具备通用工具使用能力的大型语言模型。

Post-Training-Data-Flywheel开源项目 – 优化后期训练的数据工具

为大型语言模型(LLMs)提供高质量、大量数据的搜索、选择和合成，以优化模型的后期训练

research-template开源项目 – 为机器学习研究提供高效项目架构

一个为机器学习研究量身定制的GitHub模板，帮助研究人员快速搭建高效、规范的项目架构。

ml-engineering开源项目 – 帮助训练大型语言和多模态模型

一系列开放的方法，可帮助成功训练大型语言模型和多模态模型，包含丰富的脚本和技术材料，基于作者的实践经验，并提供持续更新的知识库。

LLaMA-MoE开源项目 – 混合专家模型的持续预训练

基于LLaMA和SlimPajama的MoE模型，旨在利用混合专家模型进行持续预训练。该模型结合了LLaMA和SlimPajama的优点，通过支持混合专家架构，提高模型的效率和性能，同时能够进行持续的预训练，以适应不同的任务，灵活的模型配置使其适用于多种应用场景。

NeMo Curator开源项目 – 用于创建和处理NLP数据集

一个 Python 库，用于创建和处理自然语言处理 (NLP) 数据集，以便训练大型语言模型 (LLM)。该库包含一些可扩展的模块，允许 NLP 研究人员从无标注 Web 采集高质量文本，并提供 GPU 加速功能。

accelerate开源项目 – 简化PyTorch训练脚本的运行

accelerate是一个工具，可以帮助用户在多种设备上简单地运行PyTorch训练脚本，支持多GPU和TPU训练，并提供了易于集成的解决方案。它使得混合精度训练变得简单，同时支持分布式训练，用户可以通过命令行接口轻松启动训练任务。

Cray-LM开源项目 – 开源的LLM训练与推理平台

一个开源的LLM训练与推理一体化平台，让大模型的开发和部署变得简单高效。

Machine learning at scale官网 – 提供大规模机器学习系统的见解

大规模机器学习是一个网站，提供来自顶尖科技公司的机器学习系统的见解，涵盖分布式训练、特征存储、设备模型部署、对抗样本的稳健性、行业角色等主题。

潜在空间推理训练官网 – 高效推理训练方法

该论文提出了一种在潜在空间（latent space）中进行推理训练的方法，不需要特殊训练数据，且能处理难以用语言描述的推理任务。3.5B 的参数达到了 50B 参数模型的推理基准性能。

Cube Studio开源项目 – 一站式AI开发平台

一站式AI开发平台，支持机器学习、深度学习和大模型开发。它提供从数据管理到模型部署的全流程支持，涵盖在线开发、分布式训练、推理服务等功能，帮助企业和开发者高效构建AI应用。

Search-R1开源项目 – 高效强化学习训练框架

Search-R1 是一个基于 veRL 的高效、可扩展的强化学习（RL）训练框架，专门用于训练推理和搜索引擎调用交错的大型语言模型（LLM）。它通过规则化奖励机制，使基础 LLM 能够自主发展推理和调用搜索引擎的能力，并提供详细的安装指南和快速入门教程，支持使用自定义数据集和搜索引擎。

NKvax开源项目 – JAX框架下的高效FlashAttention实现

Kvax是为JAX框架打造的高效FlashAttention实现，专为长序列和分布式训练优化。它通过支持高效文档掩码计算、实现上下文并行化以及优化长序列处理性能，显著提升了训练效率和内存利用率。

solo-learn开源项目 – 自监督视觉表征学习库

solo-learn 是一个基于 Pytorch Lightning 的库，专注于视觉表征学习的自监督方法。它提供了多种最先进的自监督学习技术，支持混合精度的分布式训练，易于使用且可轻松扩展，适合在较小设备上进行训练。solo-learn 还具备全面的文档和示例，便于用户快速上手和集成到现有的 Pytorch 工作流中。

VectorLM开源项目 – 优化中型模型在资源受限环境的训练

建立在HuggingFace模型和PyTorch Fully Sharded Data Parallelism基础上的训练套件，旨在优化吞吐量，简化在资源受限环境中训练中型模型的分布式方案设置工作流程，尤其适用于学术集群。

暂无评论

暂无评论...