RLx2是清华大学团队提出的一种强化学习专用的稀疏训练框架,能够完全基于稀疏网络训练深度强化学习模型。
研究人员设计了一种'好奇回放'算法,让AI智能体优先回放那些最有趣和新奇的经历,从中学习。这种方式让AI智能体表现出更多的好奇心和探索欲,更快地接近和与新物体互动。
MuJoCo Playground是一个开源库,提供GPU加速的机器人学习环境,支持模拟到现实的转换,适用于多种控制任务和环境。它包括经典的控制环境,并支持四足和两足动物的行走模拟,以及非抓握和机械手的操作,此外还提供基于视觉的支持。
tinyzero是一个使用Python编写的项目,旨在轻松训练类似AlphaZero的智能体,适用于任意环境,并提供了训练和评估智能体的功能。
UnrealZoo 是一个基于 Unreal Engine 的大规模照片级虚拟世界集合,旨在为具身AI提供仿真环境,具备高质量的图形渲染和多样化的场景。
AI to Data 是一个由人工智能驱动的数据生成器,允许用户为任何用例生成真实数据。它采用先进的AI技术生成可靠和安全的数据。用户只需注册或登录平台,提供自然语言查询以指定所需数据类型和行数,系统将生成请求的数据,用户可以以CSV文件格式下载。
Zeroth Bot是一款3D打印的开源仿人机器人平台,适用于模拟现实转换和强化学习。它的特点是超级可hack、性价比高,从硬件到SDK再到模拟环境全部开源,材料清单起始成本仅350美元,极大降低了制造和开发的门槛。
CivRealm是一个基于开源游戏Freeciv-web的学习和推理环境,提供了基于强化学习和语言模型的决策智能体接口,以及训练和评估工具和基线模型,旨在成为复杂环境中学习和推理代理的测试平台。
Eureka是一个程序,能够自动生成算法来训练机器人,使它们能够更快地学习复杂的技能。生成的奖励程序在超过80%的任务上表现优于由专家编写的人工程序。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型