ToolBench-评估开源语言模型的工具官网

一个基准测试工具，用于研究和评估开源大型语言模型在软件工具操作方面的能力，提供了多样化的软件工具和易于使用的基础设施，可以直接评估每个模型的执行成功率。
ToolBench的特点:
1. 评估大型语言模型在软件工具操作方面的能力
2. 提供多样化的软件工具
3. 易于使用的基础设施
4. 直接评估模型的执行成功率

ToolBench的功能:
1. 用于研究不同大型语言模型的工具操作能力
2. 评估模型在具体任务中的表现
3. 比较多个模型在相同环境下的执行结果

相关推荐

NAwesome-Prompt-Adapter-Learning-for-Vision-Language-Models-视觉-语言模型的Prompt/Adapter学习工具

为视觉-语言模型（例如CLIP）提供精心策划的Prompt/Adapter学习方法列表，包含最新的研究进展和代码实现，促进模型的高效学习和应用

raycast-openai-translator

这个开源项目是一个翻译插件，可以在 Raycast 中使用。它使用 ChatGPT API 进行翻译，可以帮助用户轻松进行翻译操作。

VPet-开源桌宠模拟器

虚拟桌宠模拟器，一个开源的桌宠软件，可以内置到任何WPF应用程序，包含多达32(种) * 4(状态) * 3(类型)种动画。

NAI-ContentCraft-多功能的内容创作助手

AI-ContentCraft是一款多功能的内容创作助手，能用AI快速生成故事、播客脚本和多媒体内容，让创作者轻松搞定创意内容。

NChat-Ext-AI 聊天交互的开源扩展

Chat-Ext 是一个开源的 Chrome 扩展程序，允许用户通过 Hugging Face 模型与网页内容进行 AI 聊天交互，同时支持本地 LLM 服务器，为用户提供智能辅助和实时互动体验。

ChatGPT-API-server

这是一个通过远程访问部署在支持国家网内的ChatGPT API服务器，用Go语言编写。它是一个开源项目，主要功能是为ChatGPT提供API服务。ChatGPT是一个机器学习项目，可以用于实现聊天机器人等应用。

Superflows-为SaaS产品构建AI助手

Superflows是一个开源工具包，用于为SaaS产品构建AI助手，用户可以用自然语言提问，然后助手调用软件API来回答问题。

NModded-NanoGPT-高效简化的GPT-2模型训练器

基于PyTorch的GPT-2模型训练器，优化效率和代码简化，实现现代技术如旋转嵌入，以更少的token达到相同验证损失。该项目专注于提升模型训练的效率，使得用户能够在多种深度学习任务中更便捷地使用GPT-2架构。

NBasis Robotics Framework-面向生产的机器人开发框架

一个面向生产的机器人开发框架，以发布-订阅架构为基础，致力于让机器人代码易于测试和开发，强调确定性测试和易用性。

NAnthropic Cookbook-展示Claude使用方法的笔记本集合

Anthropic Cookbook是一个包含多个笔记本和食谱的集合，展示了使用Claude的有趣且有效的方法，旨在帮助用户通过互动式学习掌握Claude的功能。

Nuvtrick-在不同虚拟环境间运行Python代码的有趣工具

uvtrick是一个有趣的派对把戏，可以让用户在一个虚拟环境中运行另一个虚拟环境中的Python代码，从而实现跨环境的代码执行和结果传递。它通过uv和pickle技术简化了不同环境间的数据共享，提高了开发和测试的灵活性。

NRealtimeSTT-强大高效的语音转文本工具

一个强大高效、低延迟的语音转文本工具，支持状态监测和唤醒词触发。

NChatTTS_colab-简单易用的语音合成工具

基于ChatTTS的语音合成工具，支持音色抽卡、长音频生成和分角色朗读，简单易用，无需复杂安装。

Gogosseract-无 CGo 的高效光学字符识别库

Gogosseract，一个通过 Wazero 实现的无 CGo Tesseract OCR 的 Go Lib。它提供高效的光学字符识别功能，支持多种语言，易于集成到各种 Go 应用程序中。

NBakLLaVA-多模态能力增强的语言模型

将SOTA多模态能力融入语言模型，改进基础模型、修改训练过程、自定义数据集以及对LLaVA实现的重大架构更改。

NDiscoGrad-自动微分工具，优化程序控制

DiscoGrad是一个自动区分C++程序中条件分支的自动微分工具，支持通过自动微分和蒙特卡洛采样等方法进行梯度估计。它能够与神经网络集成，广泛应用于交通、人群管理、流行病学等领域的程序优化和控制问题。

NBrowser-Use-开源网页自动化库

Browser-Use 是一个开源的网页自动化库，能够让大型语言模型（LLM）与网站进行互动，通过简单的接口实现网页自动化操作，支持多标签管理、XPath提取和视觉模型处理。它兼容任意 LLM，适用于多种浏览器的自动化操作，可用于数据抓取和信息检索。

NOrca-基于GPT-4的智能语言模型

Orca是一个基于GPT-4复杂解释轨迹的渐进式学习模型，旨在推动自然语言理解与生成的前沿。它设计高效且智能的最先进语言模型，能够与OpenAI的GPT-4和PALM相媲美。

暂无评论

暂无评论...