Mistral Large 2 是一个拥有 123B 参数的稠密模型,支持多种语言和编程语言,具备强大的指令遵循能力和代理功能,能够在单个 H100 节点上进行推理,提供 128k 的上下文窗口,且在 MMLU 测试中表现优异。