发明名称 一种声学模型训练方法和装置
摘要 本发明实施方式提出一种声学模型训练方法和装置。方法包括:建立深层神经网络模型初始模型;将语音训练数据划分为N个不相交的数据子集合,针对每个数据子集合利用随机梯度下降算法更新深层神经网络模型初始模型,得到N个深层神经网络模型子模型,其中N为至少为2的自然数;融合N个深层神经网络模型子模型以得到深层神经网络模型中间模型,并当该深层神经网络模型中间模型符合预先设定的收敛条件时,判定该深层神经网络模型中间模型为训练后声学模型。本发明实施方式提高了声学模型的训练效率,并且不降低语音识别的性能。
申请公布号 CN104143327B 申请公布日期 2015.12.09
申请号 CN201310288097.6 申请日期 2013.07.10
申请人 腾讯科技(深圳)有限公司 发明人 王尔玉;卢鲤;张翔;刘海波;饶丰;李露;岳帅;陈波
分类号 G10L15/06(2013.01)I 主分类号 G10L15/06(2013.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 张驰;宋志强
主权项 一种声学模型训练方法,其特征在于,该方法包括:建立深层神经网络模型初始模型;将语音训练数据划分为N个不相交的数据子集合,针对每个数据子集合利用随机梯度下降算法更新所述深层神经网络模型初始模型,得到N个深层神经网络模型子模型,其中N为至少为2的自然数;融合所述N个深层神经网络模型子模型以得到深层神经网络模型中间模型,并当该深层神经网络模型中间模型符合预先设定的收敛条件时,判定该深层神经网络模型中间模型为训练后声学模型;该方法进一步包括:收集M个训练后声学模型,其中M为至少为2的自然数;对于同一个测试语音数据,分别使用所述M个训练后声学模型解码出M个后验概率序列;融合所述M个后验概率序列,以得到语音识别结果。
地址 518044 广东省深圳市振兴路赛格科技园2栋东403室