Open-R1-Multimodel使用交流:

Open-R1-Multimodel是基于Huggingface的Open-R1和deepseek-ai/DeepSeek-R1实现的多模式R1模型。它集成了Qwen2-VL系列、Aria-MoE等VLM transformers,并开源了首批8k专注于数学推理的多模态强化学习训练示例。数据由GPT4o创建,具有推理路径和可验证答案,基于Math360K和Geo170K数据集。
Open-R1-Multimodel的特点:
- 1. 基于huggingface/open-r1和deepseek-ai/DeepSeek-R1实现多模式R1
- 2. 集成Qwen2-VL系列、Aria-MoE和其他可用的VLM transformers
- 3. 开源首批8k专注于数学推理的多模态强化学习训练示例
- 4. 数据由GPT4o创建,具有推理路径和可验证答案,基于Math360K和Geo170K
- 5. 使用GRPO训练的开源模型
Open-R1-Multimodel的功能:
- 1. 用于多模态强化学习的训练和研究
- 2. 专注于数学推理的多模态数据集的开发和验证
- 3. 集成和测试不同的VLM transformers模型
- 4. 开源模型的训练和优化
相关导航
暂无评论...