UHGEval-中文大型语言模型的幻觉基准测试工具官网

UHGEval是一个用于无约束生成对中文大型语言模型的幻觉产生进行基准测试的工具，旨在帮助研究人员和开发者评估和分析模型的输出效果。
UHGEval的特点:
1. 支持对多个中文大型语言模型进行幻觉基准测试
2. 提供无约束生成的评估方法
3. 包含多个评估指标以分析模型输出
4. 用户友好的界面和易于使用的API

UHGEval的功能:
1. 使用预定义的数据集进行模型测试
2. 通过API调用进行自定义评估
3. 生成报告以可视化测试结果

相关推荐

Nvv-终端图像查看器，方便快捷

vv 是一个终端图像查看器，能够在终端中直接查看多种格式的图像，支持HDR图像处理和透明度设置，让用户在命令行环境中轻松查看和管理图像。

FlagAI-一个易用的多模态大模型工具包

FlagAI是一个快速、易于使用和可扩展的大模型工具包，目标是支持在多模态的各种下游任务上训练、微调和部署大规模模型。

nextjs-starter-medusa-开源电商解决方案，基于Next.js和Medusa

一个基于Next.js和Medusa构建的开源电商模板，提供灵活、高度可定制的电商解决方案，支持无头架构，适配各种设备，并能无缝集成多个支付方式，旨在帮助开发者快速搭建电商平台。

Nava-fast-check-AVA的属性基础测试支持

ava-fast-check是一个基于fast-check的库，为AVA提供属性基础的测试支持，能够自动生成测试用例，从而提高测试覆盖率和质量。

awesome-open-ended

"Awesome Open-Ended AI"是一个由Jenny Zhang在GitHub上创建的开源项目，它是一个资源列表，主要涉及开放式AI学习资源。这个项目包含了许多开源和机器学习的内容。

NLookaheadDecoding-创新的并行解码算法

Lookahead decoding是一种创新的并行解码算法，加速大LLM的推理过程，提升模型生成文本的速度，适用于需要快速回应的应用。

btw-基于OpenAI的NLP命令行助手

btw是一个基于OpenAI服务的命令行助手，专注于自然语言处理，用户可以通过简单的命令行交互来执行多种NLP任务，如文本生成和翻译等。它集成了OpenAI的强大API，提供了易于使用的界面，适合开发者和普通用户使用。

Bard

这个开源项目提供了一个API，可以让开发者使用Google AI机器人Bard的功能，进行逆向工程。

NTinyPNG4Mac-简单易用的图片无损压缩工具

基于 TinyPNG 实现的开源免费图片无损压缩客户端，提供几乎无损的压缩服务，简单易用。

ComfyUI-IPAdapter-Flux-基于FLUX.1的图像生成控制插件

基于FLUX.1的IPAdapter模型的ComfyUI插件实现，支持通过参考图像来控制生成结果。该项目提供了完整的模型权重和工作流程，可在ComfyUI中快速部署使用，同时也支持在线体验版本。

AudioCraft-生成AI音频创作工具

AudioCraft是一个生成性AI工具，帮助用户从文本提示中创建音乐和音频，支持研究人员和实践者在自己的数据集上训练模型。

Firefly-BEAM语言的新编译器和运行时

Firefly是一个新型的BEAM语言编译器和运行时，旨在提升编译和运行效率，提供更好的开发体验。它支持多种BEAM语言，具备高效的编译过程和优化的运行时性能，同时还提供实时错误检测和调试功能，方便开发者快速定位问题。

speechgpt

这个开源项目是一个语音聊天应用，名为SpeechGPT。它是免费和开源的，支持100多种语言，具有优秀的隐私保护和语音识别、语音合成功能。它使用机器学习技术，用户可以通过在网页上输入文字或语音与ChatGPT对话。

onnx-modifier-ONNX模型实时可视化编辑工具

onnx-modifier是一个基于Netron的工具，允许用户实时可视化和编辑ONNX模型，提供用户友好的图形界面，支持多种模型修改功能，并实时更新查看模型的变更。

Niup-go-Go语言跨平台UI库

iup-go是一个用于构建跨平台用户界面的Go语言库，支持Windows、macOS和Linux，使用本地控件提供原生外观，具备简单易用的API和多种布局管理功能，还能与OpenGL集成进行图形界面开发。

street-fighter-ai

这个开源项目使用深度强化学习训练了一个智能 AI 代理，可以通关《街头霸王·二：冠军特别版》关底 BOSS。大部分代码使用了 GPT-4。该项目的主要功能是训练一个深度强化学习智能 AI 代理，用于通关《街头霸王·二：冠军特别版》关底 BOSS。

Multi-LiDAR Placement for 3D Detection-研究多LiDAR布置对物体检测的影响

该项目旨在通过多LiDAR布置来提高自动驾驶中物体检测的准确性，探索不同LiDAR配置对3D检测性能的影响。

Nrlhf-summary-notes-汇总RLHF算法资料库

汇总人工反馈强化学习（RLHF）算法的资料库，旨在整理RLHF相关论文和博客，帮助理解如何通过人工反馈优化大型语言模型

暂无评论

暂无评论...