Eureka是一个程序,能够自动生成算法来训练机器人,使它们能够更快地学习复杂的技能。生成的奖励程序在超过80%的任务上表现优于由专家编写的人工程序。
高效的机器人仿真项目,能够在复杂高保真环境中进行模拟,帮助机器人更好地学习和执行任务。
LISA(Learning Interpretable Skill Abstractions)旨在通过强化学习任务来学习可解释的技能抽象,从而提高模型的可解释性。
FitPulse 是一款利用先进 GPT 技术的 AI 健身助手,能够创建个性化的锻炼程序、实时修改锻炼动作,并回答与健身相关的问题。它提供量身定制的组数、次数和锻炼建议,帮助用户实现更有效的训练目标。
RLx2是清华大学团队提出的一种强化学习专用的稀疏训练框架,能够完全基于稀疏网络训练深度强化学习模型。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型