发明名称 一种语音识别系统中的快速解码方法
摘要 本发明涉及一种语音识别系统中的快速解码方法。该方法包括下述步骤:(1)对语音识别系统中的解码运算单元进行初始化;(2)从输入解码运算单元中的长度为T的语音特征码字序列中依次取出下一个语音帧的特征码字矢量,置其为t时刻语音帧O<SUB>t</SUB>,1≤t≤T;(3)对t时刻语音帧O<SUB>t</SUB>进行过滤;(4)基于有效语音帧O<SUB>t</SUB><SUP>V</SUP>,对t时刻词典树令牌资源L<SUB>t</SUB>的每一层I的令牌资源L<SUB>t</SUB>[I]中的每一个活动节点进行判断;(5)处理处于词典树节点的令牌;(6)根据t时刻的局部路径最大概率以及前一有效语音帧对应的时刻t的局部路径最大概率,对与剪枝相关的阈值做自适应调整;(7)重复上述(2)-(6)步,输出此刻已生成的与声学模型和语言模型有最佳匹配的文本串,产生语音识别结果。与传统方法相比,采用这种策略可加快解码运算的速度。
申请公布号 CN1201284C 申请公布日期 2005.05.11
申请号 CN02148682.4 申请日期 2002.11.15
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 韩疆;颜永红;潘接林;张建平
分类号 G10L15/00 主分类号 G10L15/00
代理机构 北京律诚同业知识产权代理有限公司 代理人 王凤华
主权项 1、一种语音识别系统中的快速解码方法,包括下述步骤:(1)对语音识别系统中的解码运算单元进行初始化;(2)从输入解码运算单元中的长度为T的语音特征码字序列中依次取出下一个语音帧的特征码字矢量,置其为t时刻语音帧O<sub>t</sub>,1≤t≤T;(3)对t时刻语音帧O<sub>t</sub>进行过滤,若该语音帧被过滤掉,则执行步骤(2),否则置该语音帧为当前有效语音帧O<sub>t</sub><sup>V</sup>;(4)基于有效语音帧O<sub>t</sub><sup>V</sup>,对t时刻词典树令牌资源L<sub>t</sub>的每一层I的令牌资源L<sub>t</sub>[I]中的每一个活动节点进行判断,并对判断属于可扩展的令牌则扩展该节点令牌资源表中的令牌,并将新产生的令牌链入目标节点的令牌资源表中;其中I为索引变量,1≤I≤H;H为词典树的高度;否则执行步骤(7);(5)处理处于词典树节点的令牌;(6)根据t时刻的局部路径最大概率以及前一有效语音帧对应的时刻<img file="C021486820002C1.GIF" wi="21" he="43" />的局部路径最大概率,对与剪枝相关的阈值做自适应调整;(7)重复上述(2)-(6)步得到输入语音结束时刻T的具有最佳分值令牌的全局路径,结束令牌扩展,输出此刻已生成的与声学模型和语言模型有最佳匹配的文本串,产生语音识别结果。
地址 100080北京市海淀区中关村路17号