所有AI工具AI其他工具AI开源项目

Planetarium开源项目 – 评估语言模型规划能力的基准测试

Planetarium是一个用于评估大型语言模型将自然语言描述的规划问题转换为PDDL的基准测试工具,具备图同构的比较方法,旨在帮助研究人员分析和提升模型的性能。

标签:

Planetarium是一个用于评估大型语言模型将自然语言描述的规划问题转换为PDDL的基准测试工具,具备图同构的比较方法,旨在帮助研究人员分析和提升模型的性能。
Planetarium的特点:
1. 评估大型语言模型的能力
2. 将自然语言描述转换为PDDL
3. 提供图同构的比较方法

Planetarium的功能:
1. 使用数据集进行模型训练和评估
2. 进行规划问题的基准测试
3. 比较不同模型在翻译任务中的表现

相关导航

暂无评论

暂无评论...