发明名称 语音模型的噪声适应系统及方法
摘要 本发明的目的是通过对语音识别产生具有单个树形结构的语音模型并且使用该模型便利对带有变化SNR的有噪声语音的处理和节省计算成本。在每个SNR条件下使用噪声数据库中存储的每段噪声数据计算具有该SNR条件的所有噪声模型之间的距离并且群集添加噪声的语音。根据该群集的结果,产生一个集成噪声和SNR的单个树形结构模型空间(步骤S1至S5)。在噪声提取步骤(步骤S6),分析要识别的输入有噪声语音以提取特征参数串并且彼此比较各HMM的似然性,以从该树形结构有噪声语音模型空间选择一个最优模型(步骤S7)。对该选出的有噪声语音模型空间施加线性变换以使似然性最大化(步骤S8)。
申请公布号 CN1329883C 申请公布日期 2007.08.01
申请号 CN200410077161.7 申请日期 2004.09.10
申请人 古井贞熙;株式会社NTT都科摩 发明人 古井贞熙;張志鹏;堀越力;杉村利明
分类号 G10L15/06(2006.01);G10L15/14(2006.01);G10L15/20(2006.01);G10L15/00(2006.01);G10L21/02(2006.01) 主分类号 G10L15/06(2006.01)
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 王萍
主权项 1.一种语音模型的噪声适应系统,用于在噪声环境下使得用于任何噪声的语音模型适应要被识别的语音,所述语音模型是通过利用噪声数据库中存储的噪声数据以及干净语音数据而被学习的,所述系统包括:用于群集所述噪声数据库中存储的所有噪声数据的群集装置;用于根据由所述群集装置执行的群集的结果产生单个树形结构有噪声语音模型空间的语音模型空间产生装置;用于提取要被识别的输入有噪声语音的语音特征参数的参数提取装置;用于使用参数提取装置获得的特征参数序列来计算似然性的语音识别装置;用于从由所述语音模型空间产生装置产生的树形结构有噪声语音模型空间选择一个最优模型的选择装置;以及用于对由所述选择装置选择的模型施加线性变换以使所述模型提供进一步增加的似然性的线性变换装置;其中所述语音识别装置使用所述线性变换装置获得的模型来执行再识别。
地址 日本东京