发明名称 语音识别的置信度判决方法及装置
摘要 本发明公开了一种语音识别的置信度判决方法及装置,其中的方法包括:接收输入语音,并确定所述输入语音相对于识别语法的识别结果;确定所述输入语音相对于本征音素解码空间的竞争结果;利用所述识别结果及竞争结果计算所述识别结果的置信度;其中,所述本征音素解码空间的构建过程为:对预先训练的声学模型中所包含的各音素进行聚类,得到本征音素集;重新训练表征各本征音素的声学模型和语言模型;基于所述本征音素集以及重新训练得到的声学模型和语言模型,构建本征音素解码空间。本发明通过对各音素聚类构建出本征音素解码空间,基于该空间进行解码获取竞争结果,可确保竞争结果获取快速、有效、普适,从而对置信度进行更为准确和高效的估计。
申请公布号 CN101763855B 申请公布日期 2012.01.04
申请号 CN200910226110.9 申请日期 2009.11.20
申请人 安徽科大讯飞信息科技股份有限公司 发明人 王智国;王海坤;胡国平;魏思;潘青华;胡郁;刘庆峰
分类号 G10L15/06(2006.01)I;G10L15/10(2006.01)I 主分类号 G10L15/06(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 逯长明;王宝筠
主权项 一种语音识别的置信度判决方法,其特征在于,包括:接收输入语音,并确定所述输入语音相对于识别语法的识别结果,所述识别结果包括文本内容、先验概率以及其对应于所述输入语音的声学似然度;同时确定所述输入语音相对于本征音素解码空间的竞争结果,所述竞争结果包括一个竞争路径集合以及每一条竞争路径的先验概率以及其对应于所述输入语音的声学似然度;利用所述识别结果和竞争结果计算所述识别结果的置信度,具体包括:(1)将所述识别结果的声学似然度和先验概率以及所述本征音素解码空间的竞争结果包含的各竞争路径的声学似然度和先验概率代入如下的后验概率公式,计算所述识别结果相对于输入语音的后验概率: <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>|</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>|</mo> <mi>W</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>V</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>|</mo> <msub> <mi>V</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>其中,P(W)P(W|X)为所述识别结果的先验概率与识别结果对应于输入语音的声学似然度的乘积;P(Vi)P(X|Vi)为第i个竞争路径的先验概率与该竞争路径对应于输入语音的声学似然度的乘积;N为所述本征音素解码空间的竞争结果包含的竞争路径数;(2)将所述识别结果相对于输入语音的后验概率作为所述识别结果的置信度;其中,所述本征音素解码空间的构建过程为:对预先训练的声学模型中所包含的各音素进行聚类,得到本征音素集;重新训练表征各本征音素的声学模型和语言模型;基于所述本征音素集以及重新训练得到的声学模型和语言模型,构建本征音素解码空间。
地址 230088 安徽省合肥市高新开发区黄山路616号