发明名称 用于语音识别的声调特性
摘要 增强的声音声调特性首先通过引入带有自适应切除的在线的先行追溯基频(F<SUB>0</SUB>)轮廓而得到,这个基频用作为信号预处理前端。F<SUB>0</SUB>轮廓随后借助于时变的加权移动平均(MA)滤波器并结合F<SUB>0</SUB>轮廓的加权的(更多地关注元音)最小平方而被分解为词汇声调影响、词组语调影响、和随机影响。词组语调影响被定义为发声的F<SUB>0</SUB>轮廓的长期趋势,它可用F<SUB>0</SUB>轮廓的加权移动平均来近似,而其加权值与信号的周期性程度有关。因为它与词汇声调影响无关,所以它可在叠加的假设下通过F<SUB>0</SUB>轮廓的减法而被去除。声音声调特性被定义为两个部分。第一部分是在相邻帧上的F<SUB>0</SUB>轮廓的解除语调的二阶加权回归的回归系数,其窗口尺寸与音节的平均长度和相应于信号的周期性程度的加权值有关。第二部分涉及信号的周期性程度,它们是自相关轮廓的二阶回归的回归系数,其滞后则相应于来自先行追溯程序的音调估值的倒数。F<SUB>0</SUB>轮廓的解除语调的二阶加权回归的这些权重值被设计来增强/解除增强音调轮廓的发声的/不发声的段,以便为半发声辅音保存发声音调轮廓。这种机制的优点在于,即使语音分段具有轻微错误,用作为在线信号的预处理前端的、这些带有F<SUB>0</SUB>轮廓的先行自适应切除追溯的加权值,将为辅音的音调轮廓保留元音的音调轮廓。声调特性的这种元音保留性质具有阻止由于语音分段错误所引起的模型参量估值偏移的能力。
申请公布号 CN1343350A 申请公布日期 2002.04.03
申请号 CN00804884.3 申请日期 2000.11.10
申请人 皇家菲利浦电子有限公司 发明人 C·H·黄;F·塞德
分类号 G10L15/18 主分类号 G10L15/18
代理机构 中国专利代理(香港)有限公司 代理人 程天正;张志醒
主权项 1.一种语音识别系统,用于识别一个时间顺序输入信号,该信号代表以声调语言说话的语音;该系统包括:输入端,用于接收输入信号;语音分析子系统,用于把一段输入信号表示为观察特性矢量;以及单元匹配子系统,用于把观察特性矢量与经过训练的语音识别单元的目录进行匹配,每个单元用至少一个参考特性矢量表示;其中特性矢量包括从由特性矢量表示的语音段的估值发声强度中导出的分量。
地址 荷兰艾恩德霍芬