发明名称 基于分位数自适应裁剪的快速关键词检出方法
摘要 基于分位数自适应裁剪的快速关键词检出方法,涉及连续语音中关键词的快速检出方法。解决关键词检出系统解码过程中自适应裁剪方法不能最大程度裁剪局部路径,导致系统效率低下的问题。将检测语音特征提取得特征矢量序列,根据Viterbi解码,计算局部路径上活动模型状态产生特征矢量的概率,并累加得局部路径概率得分,再进行基于分位数的状态层局部路径裁剪,然后判断是否到达语音末尾,是则据解码过程生成的网格回溯找关键词,并基于后验概率确认关键词候选得到识别结果,否则重新解码。本发明能很好的嵌入原有的关键词检出系统,同时在解码过程中的每一时刻,都能有效裁剪掉不可能的路径,最大程度上减小搜索空间规模,提高系统检出效率。
申请公布号 CN102426836A 申请公布日期 2012.04.25
申请号 CN201110244531.1 申请日期 2011.08.25
申请人 哈尔滨工业大学 发明人 韩纪庆;袁浩;李海洋
分类号 G10L15/08(2006.01)I;G10L15/00(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 哈尔滨市松花江专利商标事务所 23109 代理人 韩末洙
主权项 基于分位数自适应裁剪的快速关键词检出方法,其特征在于基于分位数自适应裁剪的快速关键词检出方法是通过以下步骤实现:步骤一、输入待检测语音信号,对输入的待检测语音信号进行预处理,特征提取得到语音特征矢量序列X={x1,x2,...xS},其中S代表自然数;步骤二、根据Viterbi解码算法,将语音特征矢量序列在预先定义的识别网络上进行解码;步骤三、对于任意时刻t,所有局部路径向前扩展一次得相应局部路径上对应的活动模型,同时计算每个活动模型的状态产生xt的概率,并累加每个活动模型的状态产生xt的概率得相应局部路径概率得分,其中,xt∈X,1≤t≤S,t取整数;步骤四、进行基于分位数的状态层局部路径裁剪;步骤五、判断是否到达语音末尾,是则转步骤六,否则转步骤二;步骤六、根据解码过程中生成的网格回溯查找关键词,并基于后验概率确认关键词候选从而得到最终的识别结果,完成基于分位数自适应裁剪的快速关键词检出方法。
地址 150001 黑龙江省哈尔滨市南岗区西大直街92号