PushT环境:基于gymnasium的仿真环境,用于训练智能体将特定形状的块推至目标区域,支持多种观察空间和连续动作空间
tinyzero是一个使用Python编写的项目,旨在轻松训练类似AlphaZero的智能体,适用于任意环境,并提供了训练和评估智能体的功能。
mimictest是一个专注于机器人操控策略开发和测试的简单环境,支持多GPU训练和快速模拟环境搭建,旨在简化机器人学习的过程,帮助开发者更高效地验证和优化控制策略。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型