发明名称 |
一种语音识别解码效率优化方法 |
摘要 |
本发明涉及一种语音识别解码效率优化方法,实现为:对于每三帧语音特征矢量,先在弧内进行Viterbi动态规划,每一条弧上最多能够输出三个得分和对应的路径,三个得分和路径分别对应三个连续不同帧的输出;根据Viterbi算法,该三个得分和对应的路径传递到该弧的后续节点上进行竞争;保留到节点上的优胜者,在下三帧到来时继续扩展到该节点的后续出弧上去;对于最后一帧语音特征矢量,传递到解码网络最后一个节点并胜出的路径即为最优路径;回溯最优路径,得到对应的词序列,即为识别结果。本发明通过[采用效率优化的帧半同步方法,节省了识别过程中的内存访问量,提升了整个系统的效率。 |
申请公布号 |
CN103065633B |
申请公布日期 |
2015.01.14 |
申请号 |
CN201210580290.2 |
申请日期 |
2012.12.27 |
申请人 |
安徽科大讯飞信息科技股份有限公司 |
发明人 |
鹿晓亮;赵志伟;陈旭;尚丽;吴晓如;于振华;潘青华 |
分类号 |
G10L15/34(2013.01)I |
主分类号 |
G10L15/34(2013.01)I |
代理机构 |
北京科迪生专利代理有限责任公司 11251 |
代理人 |
贾玉忠 |
主权项 |
一种语音识别解码效率优化方法,其特征在于实现步骤如下:(1)对于每三帧语音特征矢量,先在弧内进行Viterbi动态规划,每一条弧上最多能够输出三个得分和对应的路径,三个得分和路径分别对应三个连续不同帧的输出;(2)根据Viterbi算法,该三个得分和对应的路径传递到该弧的后续节点上进行竞争,产生新的三个最优路径往下传递,直到传递到解码网络的最后一个节点,产生最优识别结果,所述竞争是指和对应帧的得分和路径竞争(3)保留到节点上的优胜者,在下三帧到来时继续扩展到该节点的后续弧上去;(4)对于最后一帧语音特征矢量,传递到解码网络最后一个节点并胜出的路径即为最优路径;(5)回溯最优路径,得到对应的词序列,即为识别结果。 |
地址 |
230088 安徽省合肥市高新开发区黄山路616 |