所有AI工具AI其他工具AI开源项目

Open-R1-Multimodel开源项目 – 多模态强化学习模型

Open-R1-Multimodel是基于Huggingface的Open-R1和deepseek-ai/DeepSeek-R1实现的多模式R1模型。它集成了Qwen2-VL系列、Aria-MoE等VLM transformers,并开源了首批8k专注于数学推理...

标签:

Open-R1-Multimodel使用交流:

Open-R1-Multimodel是基于Huggingface的Open-R1和deepseek-ai/DeepSeek-R1实现的多模式R1模型。它集成了Qwen2-VL系列、Aria-MoE等VLM transformers,并开源了首批8k专注于数学推理的多模态强化学习训练示例。数据由GPT4o创建,具有推理路径和可验证答案,基于Math360K和Geo170K数据集。

Open-R1-Multimodel的特点:

  • 1. 基于huggingface/open-r1和deepseek-ai/DeepSeek-R1实现多模式R1
  • 2. 集成Qwen2-VL系列、Aria-MoE和其他可用的VLM transformers
  • 3. 开源首批8k专注于数学推理的多模态强化学习训练示例
  • 4. 数据由GPT4o创建,具有推理路径和可验证答案,基于Math360K和Geo170K
  • 5. 使用GRPO训练的开源模型

Open-R1-Multimodel的功能:

  • 1. 用于多模态强化学习的训练和研究
  • 2. 专注于数学推理的多模态数据集的开发和验证
  • 3. 集成和测试不同的VLM transformers模型
  • 4. 开源模型的训练和优化

相关导航

暂无评论

暂无评论...