一个用于评估AI在高考中的表现的项目,旨在通过与真实高考分数线的对比,深入了解大模型在各科目的能力。
GAOKAO-Eval的特点:
1. 支持对多个AI大模型进行高考全科目评测
2. 提供公开的评测结果和详细的评测细节
3. 能够比较不同AI模型在文科和理科的表现
4. 评测涵盖语文、数学、外语以及理综/文综等多个科目
5. 评测结果能与具体高校的录取分数线进行对比
GAOKAO-Eval的功能:
1. 利用项目代码评测指定AI模型的高考表现
2. 分析模型在不同科目中的得分与实际分数线的关系
3. 进行多模态大模型对带图题目的答题能力评估
4. 查看评测报告以了解各模型的优势和短板
5. 为大模型的再训练和优化提供数据支持
相关推荐
暂无评论...