Audio-Reasoner使用交流:

Audio-Reasoner是首个支持原生深度推理的大规模音频语言模型,基于大规模音频链式思维数据(CoTA)进行训练,实现了音频领域的深度推理和结构化思维。
Audio-Reasoner的特点:
- 1. 实现音频领域的深度推理和结构化思维
- 2. 构建了120万推理丰富的高质量数据集CoTA
- 3. 在MMAU-mini和AIR-Bench-Chat基准测试中性能大幅提升
Audio-Reasoner的功能:
- 1. 用于音频领域的深度推理任务
- 2. 应用于多模态理解场景
- 3. 用于构建和训练高质量音频推理数据集
- 4. 在基准测试中评估音频语言模型的性能
相关导航
暂无评论...