发明名称 自动语音识别方法和系统
摘要 本发明公开了一种语音识别方法和系统,包括:对词进行分类,将总体语言模板中的生僻词替换为其所属的分类标记,并分别构建主解码资源网络和各分类的子解码资源网络。在解码时,先在主解码资源网络中对输入语音进行解码,当遇到分类标记时则跳出主解码资源网络,进入该分类标记对应的子解码资源网络中继续解码;在子解码资源网络中解码结束后再跳回到主解码资源网络,并在主解码资源网络中对生僻词后续的语音继续解码。通过这种子解码资源网络的处理,可以明显提高生僻词语在主解码资源网络中的过低的概率值,因此可以降低生僻词语的语音发生数据偏移的几率,提高了对于生僻词语的语音的识别准确率。
申请公布号 CN103971686B 申请公布日期 2015.06.10
申请号 CN201310037464.5 申请日期 2013.01.30
申请人 腾讯科技(深圳)有限公司 发明人 岳帅;卢鲤;张翔;谢达东;陈波;饶丰
分类号 G10L15/28(2013.01)I 主分类号 G10L15/28(2013.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 张晓峰;宋志强
主权项 一种语音识别处理方法,其特征在于,包括:对词进行分类,将总体语言模型中的生僻词替换为其所属的分类标记;构建主解码资源网络,包括:根据语音模型、主网络词典以及总体语言模型,构建主解码资源网络;在构建该主解码资源网络的过程中,在该主解码资源网络中加入分类标记节点,并将分类标记节点与其它节点用边连接;构建子解码资源网络,包括:根据语音模型、主网络词典、子网络词典以及各分类的分类语言模型,构建各分类语言模型对应的子解码资源网络;在构建每个子解码资源网络的过程中,对于子解码资源网络的链路,以主网络词典中每个词的结尾音素或静音作为开始位置,以主网络词典中每个词的开始音素或静音作为结束位置;解码过程,包括:根据所述主解码资源网络对输入的语音进行解码识别,当解码令牌遇到分类标记节点时,保存该分类标记节点前的边和音素,并跳转到该分类标记对应分类的子解码资源网络中;以所述分类标记节点前的音素作为索引找到该子解码资源网络中的开始位置,从该开始位置在子解码资源网络中对输入的语音进行解码识别直到结束位置,并保存结束位置前的音素;之后跳回到主解码资源网络的所述分类标记节点前的边,且以所述结束位置前的音素为索引找到后续解码的开始位置,从该开始位置继续对输入的语音进行解码识别。
地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室