一个让构建和优化LLM评估器变得简单有趣的原型应用。提供游戏化的界面帮助用户构建LLM评估器,包含了对标注数据的评估工具、半自动优化功能,以及一个迭代工作流来对齐标注者与AI输出。
ALIGN Eval的特点:
1. 游戏化的界面
2. 标注数据的评估工具
3. 半自动优化功能
4. 迭代工作流对齐标注者与AI输出
5. 适用于任何二分类提示词的优化
ALIGN Eval的功能:
1. 构建LLM评估器
2. 优化二分类提示词
3. 评估标注数据
4. 使用迭代工作流进行对齐
相关推荐
暂无评论...