AI开源项目

Audio-Reasoner开源项目 – 首个音频深度推理大模型

Audio-Reasoner是首个支持原生深度推理的大规模音频语言模型,基于大规模音频链式思维数据(CoTA)进行训练,实现了音频领域的深度推理和结构化思维。

标签:

Audio-Reasoner使用交流:

Audio-Reasoner是首个支持原生深度推理的大规模音频语言模型,基于大规模音频链式思维数据(CoTA)进行训练,实现了音频领域的深度推理和结构化思维。

Audio-Reasoner的特点:

  • 1. 实现音频领域的深度推理和结构化思维
  • 2. 构建了120万推理丰富的高质量数据集CoTA
  • 3. 在MMAU-mini和AIR-Bench-Chat基准测试中性能大幅提升

Audio-Reasoner的功能:

  • 1. 用于音频领域的深度推理任务
  • 2. 应用于多模态理解场景
  • 3. 用于构建和训练高质量音频推理数据集
  • 4. 在基准测试中评估音频语言模型的性能

相关导航

暂无评论

暂无评论...