发明名称 基于动态剪枝束宽预测的语音识别效率优化方法
摘要 本发明公开了一种基于动态剪枝束宽预测的语音识别效率优化方法,该方法针对传统语音解码剪枝算法中存在较多冗余路径,以及已有改进算法中剪枝有效性不足问题,提出基于声学特征进行动态剪枝束宽的预测思路,并根据实现复杂度的不同,提出两种具体的建模方式和相应的参数估计训练方法,从而提高了语音识别解码效率。
申请公布号 CN105845128A 申请公布日期 2016.08.10
申请号 CN201610214520.1 申请日期 2016.04.06
申请人 中国科学技术大学 发明人 刘俊华;凌震华;戴礼荣
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L15/08(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京凯特来知识产权代理有限公司 11260 代理人 郑立明;郑哲
主权项 一种基于动态剪枝束宽预测的语音识别效率优化方法,其特征在于,包括:基于训练好的神经网络模型从输入的训练语音数据中提取出相应的神经网络声学特征;根据提取出的神经网络声学特征采用维特比解码的方式,计算输入的训练语音数据对应的全局最优路径及每帧对应的得分,以及每帧数据局部最优路径的得分,从而获得每帧数据的临界剪枝束宽;利用每帧数据的临界剪枝束宽与对应的神经网络声学特征,来确定动态剪枝束宽预测模型并估计相应的模型参数;根据所述动态剪枝束宽预测模型以及相应的模型参数,估计待识别语音数据中每一帧数据对应的剪枝束宽,并利用估计出的剪枝束宽替代原始的固定剪枝束宽,从而提高待识别语音数据的语音识别效率。
地址 230026 安徽省合肥市包河区金寨路96号