发明名称 声音识别系统
摘要 从含有可积性失真和可加性噪声的初始噪声HMM的声音HMM10中生成初始合成HMM16,同时由雅可比矩阵计算单元19计算雅可比矩阵J。将可积性失真的估计值Ha^(cep)、可加性噪声Na(cep)和初始噪声HMM17的可加性噪声Nm(cep)合成所得的噪声变化量Namh(cep)与雅可比矩阵相乘,其中将相乘结果和初始合成HMM16进行合成,并生成自适应HMM26。从而可以事先生成与从真正讲话声音中生成的观察值序列RNa(cep)相匹配的自适应HMM26。当通过将观察值序列RNa(cep)与自适应HMM26对照进行声音识别时,抵消了可积性失真和可加性噪声的影响,其中可以获得与利用纯声音实现声音识别的情况等效的效果,并可以实现抗干扰的声音识别系统。
申请公布号 CN1345030A 申请公布日期 2002.04.17
申请号 CN01140615.1 申请日期 2001.09.18
申请人 日本先锋公司 发明人 濑尾寻;驹村光弥;外山聪一
分类号 G10L15/00;G10L15/20;G10L15/14;G10L13/00 主分类号 G10L15/00
代理机构 北京市柳沈律师事务所 代理人 黄小临;王志森
主权项 1.一种声音识别系统,包括:声音模型,从事先采集的、包含可积性失真的声音中生成;噪声模型,从事先采集的可加性噪声中生成;第一估计单元,估计包含在声音模型中的可积性失真的第一估计值;合成声音模型,根据附加了噪声的声音生成,所述声音是通过合成声音模型、可积性失真的第一估计值和噪声模型的可加性噪声进行处理而得到的;计算单元,根据噪声模型的可加性噪声和附加了噪声的声音计算雅可比矩阵;第二估计单元,估计包含在讲话声音中的可积性失真的第二估计值;第一运算单元,通过将在非讲话期间生成的可加性噪声、噪声模型的可加性噪声、和第二估计单元估计的可积性失真的第二估计值合成在一起的处理,获得噪声变化量,所述第一运算单元同时将噪声变化量与计算单元计算的雅可比矩阵相乘;自适应模型,通过将第一运算单元获得的相乘结果与合成声音模型合成在一起的处理生成;和第二运算单元,通过将讲话声音与第二估计单元估计的可积性失真的第二估计值合成在一起的处理,生成观察值序列;其中,声音识别是通过将观察值序列与自适应模型相对照实现的。
地址 日本东京都