发明名称 语音识别的健壮特征提取方法和装置
摘要 本发明涉及一种在有噪声环境下用于语音识别的健壮(robust)特征提取方法和装置,在其中按频谱分量的特征对一个语音信号分段。将语音信号划分成L次能带中的许多短期频谱分量,其中的L=1,2,...,并且根据仅含噪声的片段估算一个噪声频谱。然后根据对应的短期频谱执行对估算的噪声频谱的频谱减法,并且为各个短期频谱分量计算出含噪声的概率。最后为含语音的概率很低的各短期频谱的这些频谱分量执行内插,以便平滑那些仅含噪声的短期频谱。通过对含噪声的频谱分量执行内插就能从近旁找到可靠的频谱语音分量。
申请公布号 CN1185622C 申请公布日期 2005.01.19
申请号 CN00815076.1 申请日期 2000.09.30
申请人 艾利森电话股份有限公司 发明人 R·布吕克纳;H·-G·希尔施;R·克利施;V·斯普林格
分类号 G10L15/20 主分类号 G10L15/20
代理机构 中国专利代理(香港)有限公司 代理人 王岳;陈霁
主权项 1.一种在有噪声环境下用于语音识别的健壮特征提取方法,在其中按频谱分量对一个语音信号分段,它包括以下步骤:-将语音信号划分成L子带中的许多短期频谱分量,其中的L=1,2,...-根据仅含噪声的片段估算一个噪声频谱,-根据对应的每一子带的短期频谱执行对估算的噪声频谱的频谱减法,得到估算的频谱分量,-为各个短期频谱分量计算出含噪声的概率,以及-如果为短期频谱分量计算出的含语音概率低于一个阈值,就插入各个短期频谱的估算频谱分量。
地址 瑞典斯德哥尔摩
您可能感兴趣的专利