Nkcores-llm-arena开源项目 – 大模型性能评测平台
KCORES大模型竞技场是一个专注于评测和比较不同大语言模型(LLM)性能的项目,特别关注Qwen系列模型的表现。它提供了多种真实世界场景的编程测试集,支持多项目测试,如mandelbrot-set-meet-libai、mars-mission、solar-system、ball-bouncing-inside-spinning-hexagon等。项目提供详细的得分和具体分析,帮助用户了解模型在不同任务中的表现,并与线上版本模型进行对比,评估开源模型的性能。此外,它还支持单机部署,提供最具性价比的模型测试环境。