Llama3-S是一个扩展文本基础的大型语言模型,具备原生的‘听力’能力。通过早期融合模型训练,Llama3-S实现了声音识别与文本理解的有效结合,适用于多种语言处理任务。
Articula是一个AI翻译工具,可以实时翻译语音和视频通话,让用户以自己的声音进行交流,支持多种语言,具有低延迟特性。
Whisper-V3 是最新的开放源代码语音识别模型,相较于 Whisper-V2 有了显著改进,能够将音频直接转换为文本,并支持多任务处理,适用于多种应用场景。