VLABench-大规模视觉语言代理评估平台官网

VLABench是一个大规模基准测试平台，专为公平评估视觉语言代理、具身代理和视觉语言模型而设计，提供长视野推理任务的支持，适用于多种任务和场景，旨在为研究人员和开发者提供标准化的测试环境。
VLABench的特点:
1. 公平评估视觉语言代理
2. 支持具身代理的基准测试
3. 专注于长视野推理任务
4. 适用于多种任务和场景
5. 提供早期预览版本

VLABench的功能:
1. 用于评估视觉语言模型的性能
2. 进行长视野推理任务的基准测试
3. 为研究人员和开发者提供标准化测试环境
4. 支持不同类型的代理系统的比较

相关推荐

gptlink

GPTLink是一个开源项目，可以快速搭建自己的ChatGPT环境，且可免费商用。它包含了用户、订单、任务、付费等功能，是一个与机器学习相关的项目。此外，GPTLink还涉及到机器学习算法，可以使用免费可商用模型。

fideo-live-record-简易直播录制工具

基于React、Ffmpeg和Electron的直播录制软件，支持多平台直播内容的监控与录制，简化用户录制直播并保存为MP4视频的过程。它是一款开源免费且易于使用的工具，能够帮助用户快速录制直播并保存为MP4格式，支持多种直播平台，提供友好的用户界面，适用于Windows和macOS系统。

chatgpt-telegram-bot

这个开源项目是一个基于Node.js的ChatGPT Telegram Bot，支持无浏览器和浏览器API。其功能是在Telegram上聊天，使用机器学习技术。

NSelf-Correction LLMs Papers-自我修正大型语言模型的研究论文集

这是一个关于自我修正大型语言模型及其自动反馈机制的研究论文集合，旨在为研究人员和开发者提供最新的参考资料和研究进展。

DodgeDrone-基于视觉的灵活无人机飞行

DodgeDrone是一个旨在开发和比较基于视觉的灵活飞行算法的项目，参与了2022年国际机器人与自动化会议（ICRA）的竞赛。该项目专注于无人机的高效路径规划和避障能力，旨在提升无人机在动态环境中的飞行表现。

LOTUS-使用LLM简化数据处理

LOTUS是一个语义查询引擎，能够利用大型语言模型（LLM）轻松处理数据，类似于编写Pandas代码的简单性，旨在简化数据操作的复杂性，使数据分析更加高效和准确。

ChatGPT

该开源项目的功能包括： 1. 将 ChatGPT 放到桌面； 2. 支持快捷键、斜杠命令、划词搜索； 3. 具有导出记录的功能； 4. 适用于 macOS、Windows、Linux 操作系统。

Awesome Black Friday / Cyber Monday-黑色星期五和网络星期一的优惠精选

这是一个精心策划的黑色星期五和网络星期一优惠列表，涵盖应用、SaaS、书籍、课程等多个领域的折扣信息。

AutoML Toolkit-构建强大的AutoML系统的框架

AutoML Toolkit是一个用于构建AutoML系统的框架，旨在通过简明的研究成果支持各种AutoML设计决策，允许简单原型扩展到可用的计算资源，并提供一个可扩展的框架来构建真实而强大的AutoML系统。

NLaBraM-脑机接口中的EEG数据处理模型

LaBraM是一个用于学习通用表示的大型脑模型，专门处理大量的脑电图（EEG）数据，旨在提高脑机接口（BCI）的性能。该项目结合了现代机器学习技术，以便从复杂的EEG信号中提取有价值的信息，推动脑机交互的发展。

jo-命令行Json输出工具

jo是一个命令行工具，旨在简化生成JSON格式的数据。它支持多种数据类型，包括字符串、数字和布尔值，用户可以方便地创建嵌套对象和数组，并自定义键和值。

GreatMaster-与GreatMaster互动，促进思考和成长

用一个Prompt来与一个GreatMaster进行互动，从而触发思考和成长。用户可以通过复制'master.pdl'文件的内容与ChatGPT进行交流，并支持多种命令与GreatMaster进行沟通，帮助用户更好地进行思考和自我提升。

SuperAGI

SuperAGI是一个开发者优先的开源自主人工智能代理框架，它旨在帮助开发者快速而可靠地构建、管理和运行有用的自主代理。该框架提供了丰富的工具和功能，使开发者能够充分发挥他们的创造力和想象力，以创建出高效、智能的代理系统。开发者可以利用SuperAGI的强大功能，自由地实现各种自主代理应用，从而满足不同领域的需求。SuperAGI框架的开源性质也使得开发者可以共享和交流他们的创意和经验，从而推动自主代理技术的发展和创新。总而言之，SuperAGI是一个支持开发者构建有用自主代理的开源框架，为他们提供了便捷、可靠和创新的工具和功能。

chat_templates-支持多种语言模型的聊天模板

大型语言模型(LLM)的chat模板，用于支持transformers的chat_template功能，旨在为不同模型提供一致的输入格式，提供了多个流行模型的示例模板。该项目为开发人员提供了便捷的工具，简化了与不同语言模型的交互流程，确保输入格式的一致性，提高了开发效率。

llama-node

llama-node是一个基于Node.js的大型语言模型，可以在本地的笔记本电脑CPU上运行，支持llama/alpaca模型，旨在促进AI的民主化。该项目是机器学习领域的开源项目。

NTEN Framework-全球首个实时多模态AI Agent框架

TEN Framework是下一代AI Agent框架，支持高性能实时多模态交互，能够进行跨语言(C++/Go/Python)和跨平台开发，具备边缘云集成能力。

NLLM-Agent-Paper-Digest-LLM-agent相关文献资源汇总

基于LLM的Agent相关文献资源列表，包含在顶级会议上发表的与LLM-agent相关的论文。该项目旨在为研究人员提供一个便捷的平台，汇总最新的研究成果，方便他们获取和引用相关文献，从而推动LLM-agent领域的研究进展。

Inferflow-高效可配置的LLM推理引擎

Inferflow是一个高效且高度可配置的大型语言模型(LLM)推理引擎，支持多种Transformer模型，用户无需编写源代码，只需通过简单修改配置文件即可进行服务，旨在提供高效的推理性能，适应不同需求。

暂无评论

暂无评论...