发明名称 |
一种语音识别结果纠错方法 |
摘要 |
本发明涉及语音识别技术领域,特别是一种语音识别结果纠错方法。利用可纠错知识库对识别结果进行纠错的方法,该方法的最基本的特征,一是以语料库中的连续语言片段作为纠错模版,利用语料库建立纠错模版库;二是对纠错模版库建立索引,使用检索技术对纠错模版进行快速查找;三是依据纠错模式,利用置信度将识别结果切分成短的识别片段,并将识别片段中的可信赖部分提交的纠错模版系统进行快速查找,得到与识别片段相关性高的纠错模版候选;四是利用声学混淆度矩阵从纠错模版候选中挑选与识别片段声学特征相近的模版进行替换纠错。 |
申请公布号 |
CN1979638A |
申请公布日期 |
2007.06.13 |
申请号 |
CN200510127447.6 |
申请日期 |
2005.12.02 |
申请人 |
中国科学院自动化研究所 |
发明人 |
王晓瑞;江杰;王士进;丁鹏;徐波 |
分类号 |
G10L15/28(2006.01);G10L15/00(2006.01) |
主分类号 |
G10L15/28(2006.01) |
代理机构 |
中科专利商标代理有限责任公司 |
代理人 |
段成云 |
主权项 |
1.一种语音识别结果纠错方法,包括以下步骤:1)识别系统对输入语音进行识别运算和置信度计算,得到带有置信度的识别结果;2)依据纠错模式,按照置信度的高低将识别结果切分成小的识别片段;3)将所得到的识别片段输入到纠错模版检索系统,得到与识别片段相关性高的纠错模版候选列表;4)计算识别片段与候选列表中纠错模版的声学混淆度,挑选其中声学相似度最高的模版,当识别片断与该纠错模版的相似程度大于一个可信赖的门限时,使用纠错模版代替该识别结果片段;5)将纠错后的片段合并,得到纠错后的识别结果。 |
地址 |
100080北京市海淀区中关村东路95号 |