AgentBoard-评估多轮对话智能体能力官网

AgentBoard是一个多轮LLM智能体的分析评估排行榜，旨在评估大型语言模型的通用Agent能力。它提供全面的性能分析和可视化结果，支持多种模型的比较，帮助用户深入理解智能体在对话中的表现。
AgentBoard的特点:
1. 支持多轮对话的评估
2. 提供智能体性能的全面分析
3. 支持多种大型语言模型的比较
4. 可视化评估结果
5. 友好的用户界面

AgentBoard的功能:
1. 通过上传对话数据评估LLM智能体
2. 使用内置工具生成智能体的性能报告
3. 比较不同智能体在相同任务上的表现
4. 通过图形界面查看评估结果
5. 定制评估指标和参数

相关推荐

Nebook2audiobook-将电子书轻松转换为有声书的工具

ebook2audiobook是一款开源工具，支持1100+种语言，能够将各类电子书一键转换为带章节的有声书，使用高质量的AI语音合成技术，并可克隆个人声音进行朗读，提供简单直观的网页界面和命令行模式，适合不同用户的需求。

NOpenGPTs-开源可定制的 GPT 模型项目

OpenGPTs 是一个开源实验项目，旨在提供可定制的 GPT 模型，紧跟 OpenAI 的前沿技术。它允许用户根据自己的需求创建和调整模型，以便进行更灵活的应用和创造性实验。

NPylustrator-科学数据可视化工具

Pylustrator是一个用于创建清晰且可适应的科学研究数据可视化的界面，支持多种数据格式和形状。

vit.cpp-高效的ViT推理实现

vit.cpp是一个使用纯C/C++实现的视觉变换器（ViT）推理库，结合ggml库进行优化，旨在提供高效的图像分类解决方案，易于集成和使用，适用于各种项目和嵌入式系统。

gptlink

GPTLink是一个开源项目，可以快速搭建自己的ChatGPT环境，且可免费商用。它包含了用户、订单、任务、付费等功能，是一个与机器学习相关的项目。此外，GPTLink还涉及到机器学习算法，可以使用免费可商用模型。

wut-命令行AI工具，连接多种模型

一个命令行AI工具，支持OpenAI和Claude，能够连接本地的Ollama包装的模型。

NDAIR-V2X-大规模车辆基础设施合作3D物体检测数据集

DAIR-V2X是一个用于车辆与基础设施合作的3D物体检测的大规模数据集，旨在推动智能交通系统的发展，提供丰富的场景和多样的标签，以支持研究和应用。

NTonic Validate Metrics-开源 RAG 评估指标包

Tonic Validate Metrics 是一个开源的评估指标包，旨在为生成模型的输出提供多种评估指标，支持模型性能对比，易于集成到机器学习工作流，并兼容多种数据格式和输入类型。

pand

这个开源项目提供了四个站点，可以实现AI自由的聊天功能。其中包括了潘多拉、bing、vercel和claude站点。用户可以在云端或本地选择使用这些站点进行AI聊天。具体站点信息如下： 1. 潘多拉：提供云端的聊天模式。 2. bing：是本地聊天模式的一个选项。 3. vercel：是一个聊天机器人，用户可以通过chat.vercel.ai进行免费聊天。 4. claude：也是一个免费聊天机器人，用户可以通过easierchat.com进行使用。

NNeuroGPT-免费API服务，访问多种语言模型

NeuroGPT 是一个提供免费 API 服务的平台，用户可以方便地访问 GPT-3.5、GPT-4 及其他语言模型。它支持多种自然语言处理任务，并且具有高性能和低延迟的响应时间，适合开发者和企业使用。

NWhisper Web-浏览器中直接运行的语音识别项目

Whisper Web 是一个开源项目，允许用户在浏览器中运行基于机器学习的语音识别，无需后端服务器。它利用 WebGPU 技术实现加速，用户可以轻松进行语音转文本，并支持将识别结果导出为 TXT 和 JSON 文件格式，完全开箱即用。

Examples for crewAI-促进AI智能体之间的协作

使用crewAI框架自动化流程的示例，包括旅行规划、股票分析和页面生成等，旨在促进角色扮演AI智能体之间的协作，通过使用这些示例，可以了解如何在crewAI框架中实现自动化流程。

NMagicAnimate-AI生成舞蹈视频工具

基于SD 1.5的AI生成舞蹈视频工具，只需一张照片和一组动作即可生成近似真人的舞蹈视频。

Emu-多模态生成式模型

这是一个具有370亿参数的生成式多模态模型，使用统一的自回归目标在大规模多模态序列上进行训练。

Ngpt-review-基于AI的代码审查工具

gpt-review是一个基于Python的命令行工具和GitHub Action，利用OpenAI或Azure OpenAI模型对拉取请求内容进行审查，帮助开发者提高代码质量。

NSynthMoCap-无需标记的全息动作捕捉

SynthMoCap是一个无需标记的全息动作捕捉项目，提供合成数据集，支持身体、面部和手部数据，适用于动作捕捉研究，结合了最新的计算机图形学技术。

Nmllm-移动设备上的多模态语言模型推理引擎

mllm是一个专为移动和边缘设备优化的轻量级多模态大型语言模型推理引擎，能够在无需依赖外部库的情况下，支持多种模型和硬件架构，提供快速推理能力。

NTangoFlux-用AI快速实现高质量的文生音频

TangoFlux 是一款超快且忠实的文字转音频生成器，采用流匹配技术，能够快速将文本转换为高质量的音频。它具有惊人的效率和领先的性能，支持多种语言和音调，并提供易于集成的API，推动语音合成领域的发展。

暂无评论

暂无评论...