发明名称 具噪音补偿之可调适语音辨识方法
摘要 本发明系为一种具噪音补偿之可调适语音辨识方法,其系在辨识语音时,计算输入语音之每一音框其相对应于所有语音模型的最佳等化因子,并以该最佳等化因子及参考由该最佳等化因子索引而得之偏移向量来将语音模型之参数予以调适。其中,该最佳等化因子系用以对语音模型之平均值向量进行长度之调整,该偏移向量系用以对平均值向量进行方向改变之调整。据此,得以补偿环境噪音之影响,可以有效地提升在噪音环境中之语音辨识效果。
申请公布号 TW473704 申请公布日期 2002.01.21
申请号 TW089117570 申请日期 2000.08.30
申请人 财团法人工业技术研究院 发明人 简仁宗;吴国光;陈柏诚
分类号 G10L21/00 主分类号 G10L21/00
代理机构 代理人
主权项 1.一种具噪音补偿之可调适语音辨识方法,系藉由调整一隐藏式马可夫语音模型之参数以对一输入语音进行噪音之补偿,该方法主要包括下述之步骤:(A)依据该输入语音之复数音框及该隐藏式马可夫语音模型,计算该些复数音框特征向量相应于该隐藏式马可夫语音模型中之每个机率密度函数参数的最佳等化因子;以及(B)以该最佳等化因子及参考对应于该最佳等化因子并由该最佳等化因子索引而得之偏移补偿向量,而将该语音模型之参数予以调适;其中,该最佳等化因子系用以对该语音模型之平均値向量进行长度之调整,该偏移补偿向量系用以对该语音模型之平均値向量进行方向改变之调整。2.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,该等偏移补偿向量系预先依据一含有噪音之语料而建立在一参考函数表中。3.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,于步骤(A)中,系依据语音模型之参数ik =(ik,ik)而计算出相当于该音框 ik之投射的最佳等化因子。4.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,于步骤(B)中,系依据该等最佳等化因子而自该参考函数表索引取出对应之偏移向量,以供调整平均値向量之方向,俾以去除投射之偏移。5.如申请专利范围第4项所述之具噪音补偿之可调适语音辨识方法,其中,该参考函数表系依照下述之步骤建立;依据该隐藏式马可夫语音模型及该含有噪音之语料而进行运算,以求取每一音框对应于所有语音模型参数的最佳等化因子;计算出相应于该等最佳等化因子之调适偏移向量;以及依据该最佳等化因子与对应之调适偏移向量的关系,以最佳等化因子之一间隔値而对该调适偏移进行平均取样来制作该参考函数表。6.如申请专利范围第5项所述之具噪音补偿之可调适语音辨识方法,其中,该参考函数表系可在语音辨识时,以实际之输入语音而即时地予以调整。7.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,于步骤(B)中,系根据所求出之最佳等化因子e及所取出之偏移向量b(e ),而于语音辨识求取机率値之运算过程中,以eik+b(e )进行调适作业。8.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,于步骤(A)之先更包含一步骤以对输入之语音音框进行特征分析处理。9.如申请专利范围第1项所述之具噪音补偿之可调适语音辨识方法,其中,于步骤(B)之后更包含一步骤以进行维特比演算法之处理。图式简单说明:第一图:系依据本发明之具噪音补偿之可调适语音辨识方法的流程图。第二图:系依据本发明之方法以建立参考函数表之流程图。第三图:系依据本发明以建立参考函数表之方法所绘制之分布图。第四图:系依据第三图所制作之参考函数表范例。
地址 新竹县竹东镇中兴路四段一九五号