发明名称 自动语音识别方法和系统
摘要 本申请公开了一种自动语音识别方法和系统,包括:对生语料进行语料分类计算,得到一个以上不同类别的分类语料;针对所述每个分类语料进行训练得到一个以上对应的分类语言模型;依据分类的生僻程度为所述各个分类语言模型进行加权插值处理,其中各分类的生僻程度与该分类对应的加权值成正相关关系,将加权插值处理后的分类语言模型合并,得到插值语言模型;依据声学模型和所述插值语言模型构建解码资源;依据所述解码资源,对输入的语音进行解码,输出概率值最高的字符串作为所述输入语音的识别结果。利用本发明,可以提高对生僻词语的语音的识别准确率。
申请公布号 CN103971675A 申请公布日期 2014.08.06
申请号 CN201310033201.7 申请日期 2013.01.29
申请人 腾讯科技(深圳)有限公司 发明人 饶丰;卢鲤;陈波;岳帅;张翔;王尔玉;谢达东;李露;陆读羚
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L21/06(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 张晓峰;宋志强
主权项 一种自动语音识别方法,其特征在于,包括:对生语料进行语料分类计算,得到一个以上不同类别的分类语料;针对所述每个分类语料进行语言模型训练计算,得到一个以上对应的分类语言模型;依据分类的生僻程度为所述各个分类语言模型进行加权插值处理,其中各分类的生僻程度与该分类对应的加权值成正相关关系,将加权插值处理后的分类语言模型合并,得到插值语言模型;依据声学模型和所述插值语言模型构建解码资源;依据所述解码资源,对输入的语音进行解码,输出概率值最高的字符串作为所述输入语音的识别结果。
地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室