北京时间8月21日微软公司在当地时间周日宣布,其对话式语音识别系统的出错率达到5.1%,创下目前为止的最低水平,超过了去年微软人工智能及研究事业部一组研究人员所实现的5.9%出错率,达到了专业速录员的同等水平。在此次研究中,专业速录员具备重复收听录音等优势。
这两项研究都转录了Switchboard语料库的录音,Switchboard语料库是自上世纪90年代初以来,研究人员在测试语音识别系统时使用的大约2400个电话对话的集合。
这项新的研究是由微软人工智能和研究小组的研究人员完成的,他们的目标是达到与人类转录员相同的准确度水平
总的来说,最新研究的研究人员通过改进微软语音识别系统的神经网络声学和语言模型,将错误率降低了大约12%。
值得注意的是,他们还使它的语音识别器能够使用整个对话,让它根据上下文来调整它的转录,并预测接下来可能出现的单词或短语以及与人类交谈时的方式。
相关文章: