Awesome-LLM-as-a-judge-大语言模型评判任务资料库官网

一个关于LLM作为评判器的综合资料库，收集整理了大语言模型在评判任务中的应用研究，涵盖了帮助性、无害性、可靠性、相关性、可行性等多个评估维度，以及相关方法论和评估基准
Awesome-LLM-as-a-judge的特点:
1. 收集了多种评判任务的应用研究
2. 涵盖多个评估维度，如帮助性、无害性、可靠性等
3. 提供相关的方法论和评估基准
4. 为研究者提供有价值的参考资料

Awesome-LLM-as-a-judge的功能:
1. 查阅大语言模型在评判任务中的最新研究
2. 学习评判任务的不同评估维度
3. 获取相关的方法论和评估基准
4. 作为研究工作的参考资料和基础

相关推荐

NHalo-Xbox游戏《光环》的反编译与复现项目

Halo项目旨在反编译和复现Xbox游戏《光环》，提供开发者和研究者一个平台，以便深入了解游戏设计和机制。该项目支持原Xbox平台的游戏体验，并促进开源社区的协作与学习。

NTripoSR Bake-从2D图像生成3D形状

利用 TripoSR 模型从 2D 图像中推断出 3D 形状和纹理数据。该项目通过深度学习技术，能够从单张2D图像生成高质量的3D网格，支持用户进行手动几何编辑和纹理烘焙，极大地提高了生成效果和灵活性。

visual-chatgpt

这个开源项目的功能是利用ChatGPT进行对话，并且可以在聊天过程中发送和接收图像，同时能够将对话指令翻译成Stable Diffusion的prompt，并利用Stable Diffusion和ControlNet生成用户想要的图片。

NGenAI Agents-AI智能体构建学习指南

GenAI Agents 是一套全面的学习资源，帮助用户从基础到复杂场景构建生成式 AI 智能体，涵盖丰富的案例与教程。

NLLM Consortium-协调多个大型语言模型的系统

用于协调多个大型语言模型（LLM）的系统，通过迭代反馈和共识达成，来解决复杂问题

NGitHub Copilot for Xcode-为开发者提供 AI 编程助手功能

GitHub Copilot for Xcode 是一个强大的 Xcode 扩展，旨在为开发者提供 AI 编程助手功能。在编码过程中，它能够根据上下文提供实时的代码建议，帮助开发者更高效地编写代码。该工具支持多种编程语言，极大地提高了开发效率和代码质量。

NRAGent-AI驱动的智能研究助手

RAGent是一个AI驱动的研究助手，结合了向量数据库和外部API，能够提供全面的查询回答，包括PDF处理、AI驱动的查询处理、网络搜索集成以及干运模式等功能，旨在帮助用户高效获取和处理信息。

NDeita-高效的指令微调数据选择工具

Deita旨在为大型语言模型(LLM)的指令微调提供自动数据选择工具和高质量的对齐数据集，Deita模型能通过比其他SOTA LLM少10倍的指令微调数据进行训练，达到与它们相媲美的性能。

OpenLibm-高质量的独立数学库

OpenLibm是一个旨在提供高质量、可移植、独立的C语言数学库（libm），其质量超过Android源代码中的fdlibm。

NNLP-Papers-自然语言处理入门阅读列表

NLP-Papers是一个自然语言处理入门阅读列表，包含了在开始学习自然语言处理时需要关注的论文和书籍。该项目提供了核心论文的推荐、相关书籍及资源的整理，并且分类清晰，便于查找，同时会定期更新，反映最新的研究动态。

llm-action-大模型教学项目，分享技术与经验

本项目旨在分享大模型相关技术原理以及实战经验，包括大模型工程化和应用落地，降低学习难度，促进技术普及。

NMedLLMs Practical Guide-医疗大语言模型的实用指南

这是一个汇总医疗大语言模型（Medical LLMs）资源的实用指南，包括模型树、表格和论文，旨在为研究人员和开发者提供全面的参考。

Nllama-api-类OpenAI的LLaMA推理API

llama-api是一个类OpenAI的LLaMA推理API，旨在提供便捷的模型推理服务。它支持自动下载模型、并行处理和并发处理，以便用户可以高效地进行文本生成和其他相关任务。

NAwesome Reinforcement Learning for Cyber Security-强化学习在网络安全中的应用资源汇总

这是一个专注于应用于网络安全的强化学习资源的精心整理列表，包含研究论文、实用实现和相关工具，旨在帮助研究人员和开发者在这一领域获得最新的信息和技术支持。

NYearning-一个开箱即用的MYSQL SQL审核工具

Yearning 是一个简单易用的MYSQL SQL审核工具，采用Go和Vue构建，提供高性能和友好的用户界面，支持自动语法和功能性审核。

NMuJing-一个关于学习和复习的工具

MuJing 是一个专注于学习和复习的工具，支持多种学习模式，并提供个性化的复习提醒，旨在帮助用户更高效地掌握知识。

NOS-Genesis-自动化生成GUI代理轨迹工具

OS-Genesis是一款自动化GUI Agent轨迹构建工具，通过逆向任务合成技术，无需人工监督或预定义任务即可生成高质量和多样化的GUI代理轨迹数据，极大地提高了测试效率和数据多样性。

NMenagerie-高质量MuJoCo物理模型集合

Menagerie是由DeepMind策划的高质量MuJoCo物理引擎模型集合，包含多种类型的模型，适用于不同的应用场景，易于集成并提供丰富的文档和示例，帮助研究人员和开发者更好地进行物理仿真和机器人控制。

暂无评论

暂无评论...