发明名称 |
一种语音命令识别方法和装置 |
摘要 |
本发明实施方式提出一种语音命令识别方法和装置。方法包括:获取广义背景模型,并基于用户的注册语音获取用户的声纹模型;接收语音,提取所述语音的声纹特征,并基于所述语音的声纹特征、所述广义背景模型和所述用户声纹模型确定该语音是否源自所述用户;当确定所述语音源自所述用户时,识别所述语音中的命令词。本发明实施方式可以基于注册用户的声纹模型确定语音是否源自注册用户,从而提高安全性。 |
申请公布号 |
CN104143326B |
申请公布日期 |
2016.11.02 |
申请号 |
CN201310645815.0 |
申请日期 |
2013.12.03 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
岳帅;张翔;卢鲤;饶丰;王尔玉;刘海波;陈波;刘荐;李露 |
分类号 |
G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L17/02(2013.01)I;G06F3/16(2006.01)I;G10L17/24(2013.01)I |
主分类号 |
G10L15/02(2006.01)I |
代理机构 |
北京德琦知识产权代理有限公司 11018 |
代理人 |
张驰;宋志强 |
主权项 |
一种语音命令识别方法,其特征在于,该方法包括:获取广义背景模型,并基于用户的注册语音获取用户的声纹模型;接收语音,提取所述语音的声纹特征,并基于所述语音的声纹特征、所述广义背景模型和所述用户声纹模型确定该语音是否源自所述用户;当确定所述语音源自所述用户时,识别所述语音中的命令词;所述识别所述语音中的命令词包括:对语音进行低于指定精度的声学模型训练计算,得到背景声学模型;对语音进行高于指定精度的声学模型训练计算,得到前景声学模型;依据所述前景声学模型和背景声学模型构建解码网络,其中包括:从所述前景声学模型中选择命令词包含的音素,利用选出的音素构建所述命令词对应的解码路径,依据所述背景声学模型的音素构建对应的解码路径;依据所述解码网络对输入的语音进行解码,在语音结束后判断解码结果是否为指定命令词的字符串,在解码结果为指定命令词的字符串时触发该命令词对应的操作。 |
地址 |
518044 广东省深圳市福田区振兴路赛格科技园2栋东403室 |