发明名称 一种语音识别解码效率优化方法
摘要 本发明涉及一种语音识别解码效率优化方法,实现为:对于每三帧语音特征矢量,先在弧内进行Viterbi动态规划,每一条弧上最多能够输出三个得分和对应的路径,三个得分和路径分别对应三个连续不同帧的输出;根据Viterbi算法,该三个得分和对应的路径传递到该弧的后续节点上进行竞争;保留到节点上的优胜者,在下三帧到来时继续扩展到该节点的后续出弧上去;对于最后一帧语音特征矢量,传递到解码网络最后一个节点并胜出的路径即为最优路径;回溯最优路径,得到对应的词序列,即为识别结果。本发明通过[采用效率优化的帧半同步方法,节省了识别过程中的内存访问量,提升了整个系统的效率。
申请公布号 CN103065633B 申请公布日期 2015.01.14
申请号 CN201210580290.2 申请日期 2012.12.27
申请人 安徽科大讯飞信息科技股份有限公司 发明人 鹿晓亮;赵志伟;陈旭;尚丽;吴晓如;于振华;潘青华
分类号 G10L15/34(2013.01)I 主分类号 G10L15/34(2013.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 贾玉忠
主权项 一种语音识别解码效率优化方法,其特征在于实现步骤如下:(1)对于每三帧语音特征矢量,先在弧内进行Viterbi动态规划,每一条弧上最多能够输出三个得分和对应的路径,三个得分和路径分别对应三个连续不同帧的输出;(2)根据Viterbi算法,该三个得分和对应的路径传递到该弧的后续节点上进行竞争,产生新的三个最优路径往下传递,直到传递到解码网络的最后一个节点,产生最优识别结果,所述竞争是指和对应帧的得分和路径竞争(3)保留到节点上的优胜者,在下三帧到来时继续扩展到该节点的后续弧上去;(4)对于最后一帧语音特征矢量,传递到解码网络最后一个节点并胜出的路径即为最优路径;(5)回溯最优路径,得到对应的词序列,即为识别结果。
地址 230088 安徽省合肥市高新开发区黄山路616