发明名称 一种汉语语音识别可信度特征值的计算方法
摘要 本发明涉及一种计算机语音识别可信度特征值的计算方法,属于计算机语音识别技术领域。首先记录标识每帧语音最佳候选隐马尔可夫模型的三音子并构成原始三音子序列,记录标识语音识别结果的识别三音子序列;针对识别三音子序列,统计这样的三音子的个数,根据其时间对准信息从原始三音子序列中获取的对应的子序列不包含与该三音子中心基元相同的三音子,识别三音子序列中统计的这种三音子的个数,即为特征值。本发明方法仅需要记录每帧语音识别的最佳隐马尔可夫模型,并根据识别三音子序列进行比对,计算量小,计算速度快。本发明方法实现简单,可用于任何语音模型的语音识别系统,具有很好的语音识别拒识效果。
申请公布号 CN101393739A 申请公布日期 2009.03.25
申请号 CN200810225353.6 申请日期 2008.10.31
申请人 清华大学;索尼电脑娱乐公司 发明人 郑方;刘轶;曹文晓;赤羽诚;陈如新;高桥良知
分类号 G10L15/02(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京清亦华知识产权代理事务所 代理人 罗文群
主权项 1、一种计算机语音识别可信度特征值的计算方法,其特征在于该方法包括以下各步骤:(1)记录标识每帧语音的最佳候选隐马尔可夫模型的三音子,将三音子构成一个原始三音子序列,表示为:H={h<sub>i</sub>,i=1,2,...,s},其中i为语音帧的序号,s为被识别语音的总帧数;(2)将语音识别结果的可信度特征值设为零,记录标识语音识别结果的识别三音子序列,表示为:R={r<sub>j</sub>,j=1,2,...,n},其中j为识别三音子序列中的三音子序号,n为识别三音子序列中三音子的个数;(3)根据上述识别三音子序列,获取与序列中每个三音子相对应的起始语音帧的序号和结束语音帧的序号,并将起始帧和结束帧的帧序号分别表示为<img file="A200810225353C00021.GIF" wi="55" he="49" /><img file="A200810225353C00022.GIF" wi="65" he="48" />(4)根据上述三音子r<sub>i</sub>的起始帧号和结束帧号,从上述原始三音子序列中获取与三音子r<sub>i</sub>相对应的子序列,依次将子序列中的所有三音子的中心基元与识别三音子序列中的三音子r<sub>i</sub>的中心基元进行比较,若子序列中所有三音子的中心基元都与三音子r<sub>i</sub>的中心基元不相等,则上述可信度特征值加1;(5)重复步骤(4),直至遍历识别三音子序列中所有三音子,得到可信度特征值。
地址 100084北京市海淀区清华园
您可能感兴趣的专利