![](https://cdn.msbd123.com/ad/ad.png)
用JAX/Flax训练的SmolLM风格语言模型,能在有限的计算资源下高效预训练,快速达到较高性能。该项目专注于利用现代深度学习框架JAX和Flax,提供灵活的训练选项,并优化资源使用,使其适合在计算资源受限的环境中进行实验和开发。
llm-jax的特点:
- 1. 高效的预训练能力
- 2. 支持多种优化器
- 3. 适用于有限计算资源的环境
- 4. 基于JAX/Flax框架
llm-jax的功能:
- 1. 在fineweb-edu数据集上训练SmolLM风格的语言模型
- 2. 使用不同的优化器进行模型训练
- 3. 快速迭代以达到较高性能
相关导航
暂无评论...