用于评估视觉语言模型在多样化基准测试中的鲁棒性的Python库,提供60种VLM模型和40种评估基准的全面工具和脚本,支持大规模模型和大规模训练样本,简化视觉语言模型的评估过程
unibench的特点:
1. 提供60种视觉语言模型(VLM)
2. 包含40种评估基准
3. 支持大规模模型和大规模训练样本
4. 简化视觉语言模型的评估过程
unibench的功能:
1. 使用内置工具评估不同VLM模型的性能
2. 通过指定基准测试进行模型的鲁棒性测试
3. 与其他Python库集成以扩展功能
相关推荐
暂无评论...