Liger-Kernel 是一款专为大型语言模型(LLM)训练设计的高效 Triton 内核。它通过一行代码即可集成到现有训练流程中,显著提升模型性能,降低内存使用,并支持更长上下文长度、更大批量大小和庞大词汇量。