发明名称 一种提高语音识别准确率的方法及系统
摘要 本发明公开了一种提高语音识别准确率的方法及装置,其中,该方法包括:根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正;根据校正后的候选字词的语言模型概率进行语音解码处理。通过采用本发明公开的方法,提高了对用户特定信息及该信息上下文内容的识别准确率。
申请公布号 CN103903619B 申请公布日期 2016.12.28
申请号 CN201210584660.X 申请日期 2012.12.28
申请人 科大讯飞股份有限公司 发明人 潘青华;何婷婷;余健;鹿晓亮;王智国;胡国平;胡郁;刘庆峰
分类号 G10L15/18(2013.01)I;G10L15/26(2006.01)I 主分类号 G10L15/18(2013.01)I
代理机构 北京凯特来知识产权代理有限公司 11260 代理人 郑立明;赵镇勇
主权项 一种提高语音识别准确率的方法,其特征在于,包括:根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配,获得新的路径集合;通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正;根据校正后的候选字词的语言模型概率进行语音解码处理;其中,所述获得新的路径集合包括:第一次解码与第二次解码两个过程;第一次解码时,将连续语音信号数字采样为一系列离散能量值存入数据缓存区,提取语音信号中的声学特征序列,并采用快速搜索算法在由简单声学模型和大规模不受限的低阶语言模型构成的搜索空间对提取的简单声学特征进行粗略匹配,过滤不合理的识别结果获取最优路径集合;第二次解码时,首先,读取用户预置信息,该预置信息包括通讯录中的联系人、联系人所在地和/或通过其他软件预留的文字信息;若预置信息为通讯录中的联系人,则将第一次解码得到的路径集合中所有的候选字词转化为拼音,并与用户预留的人名拼音进行模糊匹配,获得新的路径集合;具体的:将人名拼音关键词和路径集合拼音串的匹配,对用户联系人名列表中的每条人名拼音串在所述解码结果拼音串集合中进行子串匹配,确定匹配关系;匹配获得一个新的路径,而新的路径位于匹配成功的候选字词对应起始节点和终止节点之间。
地址 230088 安徽省合肥市望江西路666号