基于PyTorch的易于使用的增强学习框架,通过Lightning Fabric加速。该框架旨在提供一个简单且可扩展的强化学习算法框架,同时解耦强化学习算法与环境,使其能与任何环境一起使用。
这个开源项目的功能是对类似 #ChatGPT# 的模型进行简单、快速且经济实惠的 RLHF 训练。
engshell是一个多功能的终端环境,结合了命令行界面的强大与用户友好的特性,适合开发者使用。
WorkGPT是一个智能体框架,类似于AutoGPT或LangChain,用户可以提供指令和API数组,系统将与AI进行多轮交流,直到完成任务,能够支持多种API的交互,灵活适用于多种应用场景,易于集成和扩展。
这是一个精心策划的数学优化课程、讲座、书籍、笔记、库、框架和软件的集合。
一个用于强化学习与人工反馈(RLHF)的框架,旨在简化不同 RLHF 技术的集成,提供模块化和组合式的实验能力,适用于研究人员和实践者。该框架通过模块化设计,支持多种实验能力,灵活配置选项,方便用户根据不同需求进行调整和优化。
EETQ是针对transformer模型的量化工具,使用Flash-Attention V2优化attention的推理性能,简单易用,只需一行代码即可适配您的PyTorch模型。
本书首先介绍了经典鲁棒优化和分布鲁棒优化的基本内容,随后介绍了多阶段问题及如何运用线性决策规则和鲁棒优化对多阶段问题近似求解,同时也囊括了鲁棒性优化和机器学习等最新的一些研究方向,旨在对鲁棒优化进行框架性地梳理,为有志于运用鲁棒优化解决实际问题和从事鲁棒优化学术研究的同学提供概念性和框架性的入门。
K-Scale Sim是一个简单高效的库,专为在MJX和MuJoCo中训练仿人类运动而设计,支持强化学习代理的训练和评估,提供快速原型设计、环境规范和超参数调整功能,同时通过Weights & Biases跟踪和记录训练结果。
为Rust语言打造的线性代数基础库,旨在提供一个功能全面、便于使用的线性代数解决方案,助力Rust开发者更高效地进行相关计算和开发
Aerial Gym Simulator 提供了用于训练四旋翼平台在复杂障碍物环境中学习飞行和导航的高性能仿真环境,基于NVIDIA Isaac Gym构建,支持用户自定义场景和多个训练算法。
siliconflow提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型