发明名称 语音识别的后处理方法
摘要 本发明提供一种语音识别的后处理方法,其中,所述方法包括:将语音识别结果的第一字符串进行转换,得到第二字符串;根据预设规则将所述第二字符串进行分词处理,得到分词后待检索第三字符串;将所述第三字符串在第一标准词库中进行检索,得到与所述第三字符串对应的检索结果集;采用相似矩阵确定所述第一字符串的发音相似度;根据所述检索结果集和所述发音相似度获取所述第二字符串的匹配度;根据所述第二字符串和检索结果集,获取所述第二字符串在所述检索结果集中的连续度、长度比;并采用所述连续度、长度比和匹配度获取所述第一字符串的匹配分值,根据所述匹配分值得到匹配结果。上述方法提高了现有技术中语音识别技术的语音识别准确率。
申请公布号 CN103440865A 申请公布日期 2013.12.11
申请号 CN201310339507.5 申请日期 2013.08.06
申请人 普强信息技术(北京)有限公司 发明人 叶俊;李蓉;蒲瑶;何国涛;李全忠
分类号 G10L15/08(2006.01)I;G10L15/187(2013.01)I;G06F17/30(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 刘芳
主权项 一种语音识别的后处理方法,其特征在于,包括:将语音识别结果的第一字符串进行转换,得到第二字符串;根据预设规则将所述第二字符串进行分词处理,得到分词后待检索第三字符串;将所述第三字符串在第一标准词库中进行检索,得到与所述第三字符串对应的检索结果集;采用相似矩阵确定所述第一字符串的发音相似度;根据所述检索结果集和所述发音相似度获取所述第二字符串在所述检索结果集中的匹配度;根据所述第二字符串和检索结果集,获取所述第二字符串在所述检索结果集中的连续度、长度比;采用所述连续度、长度比、匹配度和所述第二字符串的长度获取所述第一字符串的匹配分值,根据所述匹配分值得到匹配结果。
地址 100094 北京市海淀区东北旺西路8号中关村软件园广场4号