APEBench是一个用于评估偏微分方程(PDE)自回归神经仿真器的基准测试框架,提供标准化的评估工具,支持多种自回归建模配置,旨在促进不同模型和技术之间的比较。
carefree-flow是一个基于OneFlow的深度学习库,旨在简化模型构建与训练过程,提供高效的计算性能和友好的API设计,支持动态计算图,适合开发者快速原型和高性能训练需求。
用于LLM360评估和分析的代码库,包含了多种评估指标和分析方法,旨在帮助用户全面理解和优化模型表现。
Prompt2Model 是一个从自然语言指令生成可部署模型的工具,旨在帮助系统构建者通过自然语言描述任务并提供示例来创建自然语言处理系统。
收集和梳理垂直领域的开源大语言模型、数据集及评测基准,为用户提供全面的资源和支持,便于在各个专业领域内应用和研究。
一个包含1,645个具有不同种类歧义的数据集及对应的评估方法的项目。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型