发明名称 | 一种语音识别系统中的快速解码方法 | ||
摘要 | 本发明涉及一种语音识别系统中的快速解码方法。该方法包括下述步骤:(1)对语音识别系统中的解码运算单元进行初始化;(2)从输入解码运算单元中的长度为T的语音特征码字序列中依次取出下一个语音帧的特征码字矢量,置其为t时刻语音帧O<SUB>t</SUB>,1≤t≤T;(3)对t时刻语音帧O<SUB>t</SUB>进行过滤;(4)基于有效语音帧O<SUB>t</SUB><SUP>V</SUP>,对t时刻词典树令牌资源L<SUB>t</SUB>的每一层I的令牌资源L<SUB>t</SUB>[I]中的每一个活动节点进行判断;(5)处理处于词典树节点的令牌;(6)根据t时刻的局部路径最大概率以及前一有效语音帧对应的时刻t的局部路径最大概率,对与剪枝相关的阈值做自适应调整;(7)重复上述(2)-(6)步,输出此刻已生成的与声学模型和语言模型有最佳匹配的文本串,产生语音识别结果。与传统方法相比,采用这种策略可加快解码运算的速度。 | ||
申请公布号 | CN1201284C | 申请公布日期 | 2005.05.11 |
申请号 | CN02148682.4 | 申请日期 | 2002.11.15 |
申请人 | 中国科学院声学研究所;北京中科信利技术有限公司 | 发明人 | 韩疆;颜永红;潘接林;张建平 |
分类号 | G10L15/00 | 主分类号 | G10L15/00 |
代理机构 | 北京律诚同业知识产权代理有限公司 | 代理人 | 王凤华 |
主权项 | 1、一种语音识别系统中的快速解码方法,包括下述步骤:(1)对语音识别系统中的解码运算单元进行初始化;(2)从输入解码运算单元中的长度为T的语音特征码字序列中依次取出下一个语音帧的特征码字矢量,置其为t时刻语音帧O<sub>t</sub>,1≤t≤T;(3)对t时刻语音帧O<sub>t</sub>进行过滤,若该语音帧被过滤掉,则执行步骤(2),否则置该语音帧为当前有效语音帧O<sub>t</sub><sup>V</sup>;(4)基于有效语音帧O<sub>t</sub><sup>V</sup>,对t时刻词典树令牌资源L<sub>t</sub>的每一层I的令牌资源L<sub>t</sub>[I]中的每一个活动节点进行判断,并对判断属于可扩展的令牌则扩展该节点令牌资源表中的令牌,并将新产生的令牌链入目标节点的令牌资源表中;其中I为索引变量,1≤I≤H;H为词典树的高度;否则执行步骤(7);(5)处理处于词典树节点的令牌;(6)根据t时刻的局部路径最大概率以及前一有效语音帧对应的时刻<img file="C021486820002C1.GIF" wi="21" he="43" />的局部路径最大概率,对与剪枝相关的阈值做自适应调整;(7)重复上述(2)-(6)步得到输入语音结束时刻T的具有最佳分值令牌的全局路径,结束令牌扩展,输出此刻已生成的与声学模型和语言模型有最佳匹配的文本串,产生语音识别结果。 | ||
地址 | 100080北京市海淀区中关村路17号 |