一个用于评估奖励模型和LLM裁判的基准测试,帮助在大规模LLM训练和评估中复制人类偏好,包含真实的人类偏好数据和可验证的正确性偏好数据。
Preference Proxy Evaluations (PPE)的特点:
1. 评估奖励模型的能力
2. 提供真实的人类偏好数据
3. 包含可验证的正确性偏好数据
4. 用于大规模LLM训练和评估
Preference Proxy Evaluations (PPE)的功能:
1. 用于训练LLM时评估模型的表现
2. 用于验证模型是否符合人类偏好
3. 用于基准测试不同奖励模型的效果
相关推荐
暂无评论...