JailbreakBench-评估大型语言模型的鲁棒性官网

JailbreakBench 是一个开源的鲁棒性基准，旨在评估对大型语言模型(LLM)进行大规模越狱的进展，提供丰富的数据集和评估工具，以支持研究人员和开发者在这个领域的探索。
JailbreakBench的特点:
1. 提供 JBB-Behaviors 数据集，包含 100 种不同的滥用行为
2. 行为是根据 OpenAI 的使用策略性精选的
3. 提供官方的 JailbreakBench 领域表
4. 跟踪对数据集中滥用行为进行攻击和防御的算法的性能

JailbreakBench的功能:
1. 评估大型语言模型在面对越狱攻击时的鲁棒性
2. 研究和开发针对 LLM 的攻击和防御算法
3. 收集和分析不同滥用行为的影响

相关推荐

NLiteChain-轻量级LLMs应用构建工具

LiteChain是一个构建LLMs应用的轻量级替代LangChain的选择，专注于拥有小而简单的核心，易于学习、适应，文档完备，完全类型化和可组合，旨在帮助开发者快速实现复杂应用逻辑。

Nawesome-multimodal-ml-多模态机器学习资源的集合

一个多模态机器学习资源的集合，包含各种模型、工具和研究材料，旨在帮助研究人员和开发者获取相关知识和实现。

Nsocketify.py-高性能WebSocket与HTTP服务器

socketify.py是一个为PyPy3和Python3提供WebSockets和高性能Http/Https服务器的项目，旨在让开发者能够轻松创建高效的网络应用。

NThe Hugging Face Course-Hugging Face生态使用教程

Hugging Face生态(Transformers, Datasets, Tokenizers, and Accelerate等)使用教程，旨在帮助用户掌握各种工具和库，提供实践示例和交互式学习体验，适合不同水平的开发者。

NCuteGPT-中英双语的开源对话模型

CuteGPT是复旦大学知识工场实验室推出的一个支持中英双语的开源对话语言模型，基于Llama模型结构进行改进和扩展，规模为13B（130亿）参数，可以在单张3090显卡上进行int8精度的推理。

NBALROG-评估游戏环境中的智能Agent能力

一个创新的基准测试框架，专门评估大语言模型(LLM)和视觉语言模型(VLM)在游戏环境中的智能Agent能力。支持本地部署和主流AI API集成，提供完整的评估工具集，可用于测试模型在长期交互任务中的推理表现。

azure-openai-proxy

这个开源项目是一个 Azure OpenAI API 的代理工具，可以将 OpenAI 请求转换为 Azure OpenAI 请求。它的主要功能是方便作为各种开源 ChatGPT 的后端使用。

Codel

"Codel"是一款设计为完全自主的人工智能工具，意味着它能够独立操作，无需人类的持续指导或手动输入。这款AI工具被设计用来执行广泛的复杂任务和项目，这些任务和项目通常可能需要人类干预。

chatgpt-evaluation

这个开源项目是一个用于 ChatGPT 的多任务、多语言、多模态评估数据集，可用于机器学习。

NBEV-Perception-鸟瞰视图感知的资源与工具

关于鸟瞰视图感知的论文资源列表，包括3D目标检测、分割、在线地图和占据预测等，旨在为研究人员和开发者提供全面的工具和文献支持。

NH2ONet-实时3D手网格重建

H2ONet 是一个专注于手部遮挡和方向感知的网络，能够实时进行3D手网格重建，基于深度学习的高效算法，使其在各种应用中表现出色。

NGoMaxAI-ChatGPT-Midjourney-Pro-集成多种AI服务的高效平台

基于Node.js、Vue3、uniapp的AIGC平台，集成ChatGPT、Midjourney绘画、Suno音乐、视频服务等，支持私有化部署，适用于个人、团队和企业。该平台为用户提供了一站式的AI解决方案，能够满足不同用户的需求，包括创意写作、艺术创作和内容生成等。

Niup-go-Go语言跨平台UI库

iup-go是一个用于构建跨平台用户界面的Go语言库，支持Windows、macOS和Linux，使用本地控件提供原生外观，具备简单易用的API和多种布局管理功能，还能与OpenGL集成进行图形界面开发。

NOpenR-开源框架，提升语言模型推理能力

一个开源框架，专为大型语言模型提供高级推理能力，支持数据生成、策略训练和多种搜索策略，让机器更聪明地理解和解决问题。

NPython Machine Learning Book (2nd Edition)-数据科学与机器学习的分步介绍

这一系列 Jupyter Notebooks 是对数据科学和机器学习的非常好的分步介绍，适合初学者，通过实践和示例帮助读者掌握相关知识。

chatgpt-plugins-hub

ChatGPT 插件集市是一个开源的项目，目的是列出所有可用的 ChatGPT 插件以及它们的清单文件位置。这个开源项目涉及领域包括机器学习。

NMultiview Scene Graph-多视角场景图生成

该项目提供了从多个视角生成场景图的能力，能够分析复杂的场景关系，提升视觉理解能力。

NSpiderSuite-面向网络安全的高级网络爬虫

面向网络安全专业人员的高级网络爬虫，可用于自动化数据收集和网络侦查。支持多种操作系统和平台，并提供了多种功能，例如多线程爬取、代理支持、自定义头和数据等。此外，还可以进行敏感信息的收集、漏洞扫描和文件下载等任务。

暂无评论

暂无评论...