发明名称 |
一种语音识别方法和装置 |
摘要 |
本发明实施例公开了一种语音识别方法和装置,接收输入的语音片段;根据子空间分布聚类SDC计算所述语音片段每一帧的多个声学得分;将得到的所述多个声学得分和移动终端词汇库中的词汇进行比对并累加每一帧比对后的声学得分,其中总分最高的为最优声学总分;所述语音片段每一帧的最高声学得分之和为背景声学总分;比对最优和背景声学总分是否满足预订阈值;如果否,则拒识所述语音片段,可以看出,将输入的语音片段的每一帧的最高声学得分之和,与输入的语音片段和移动终端词汇库中的词汇比较得出的最高声学总分比较后差值较大的判定为错误的语音输入并进行拒识,由此大大降低移动终端根据语音输入做出误操作的频率,提高了用户的体验度。 |
申请公布号 |
CN103337241A |
申请公布日期 |
2013.10.02 |
申请号 |
CN201310231499.2 |
申请日期 |
2013.06.09 |
申请人 |
北京云知声信息技术有限公司 |
发明人 |
苏牧;李鹏;李轶杰;梁家恩 |
分类号 |
G10L15/10(2006.01)I;G10L15/26(2006.01)I |
主分类号 |
G10L15/10(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
王宝筠 |
主权项 |
一种语音识别方法,应用于移动终端,其特征在于,包括: 接收输入的语音片段; 根据子空间分布聚类SDC计算所述语音片段每一帧的多个声学得分; 根据所述声音片段的输入长度,以帧为单位,将得到的所述多个声学得分和移动终端词汇库中的n个词汇进行比对并累加每一帧比对后的声学得分,得到n个声学总分,n为大于等于1的整数,其中总分最高的设定为所述语音片段的最优声学总分; 计算在输入长度内的所述语音片段每一帧的最高声学得分之和,得到背景声学总分; 比对最优声学总分和背景声学总分是否满足预订阈值; 如果是,则确定所述语音片段为最优声学得分所对应的词汇; 如果否,则确定所述语音片段为错误的输入,拒识所述语音片段。 |
地址 |
100083 北京市海淀区中关村东路18号财智国际大厦C座1501室 |