bench.audio 是一个开源的语音代理评估基准,类似于 LMSYS 的 ELO 基准,旨在让两个不同的语音代理进行对话,并投票哪个表现更好。该项目还计划推出 GPT-4o,以进一步提升其功能和性能。