发明名称 语音分析系统
摘要 语音分析系统10包括一个滤波触排分析器18,可由两个交谈者的语音信号产生连续频率的资料向量。由每个资料向量中,单元22A和22B可补偿各个谈话者中不同形式的失真而产生一组修正资料向量。电脑24将修正资料向量匹配到隐含式马可夫之状态参数,其可计算辨认出每组中展现最大匹配机率的修正资料向量,所匹配的模型状态参数,所相关的失真形式,以及语音类或杂讯类之模型类别。匹配后的模型状态参数的平均值用以提供它所相关的资料向量的估计值,此估计值与它所相关的资料向量做比较,以其差值以及其他在无限脉冲响应滤波触排48A或48B的同类型失真的差值取平均值后提供该类型失真的补偿量。个别谈话者的多种失真形式即是由平均后之差分向量所提供的。
申请公布号 TW374152 申请公布日期 1999.11.11
申请号 TW087103902 申请日期 1998.03.17
申请人 罗伯特威廉贝克汉 发明人 罗伯特威廉
分类号 G10L5/06 主分类号 G10L5/06
代理机构 代理人 詹铭文
主权项 1.一种语音分析系统,用以分析失真之一语音,该语音分析系统包括:一补偿装置(22A,22B),由该语音获得一修正资料向量以补偿失真;一匹配装置(24),用以将该修正资料向量匹配至一模型;以及一推导装置(28),藉由该补偿装置(22A,22B)中所使用的一资料向量推导一失真补偿量,该语音分析系统之特性如下:(a)该补偿装置(22A,22B)系藉由修正一资料向量中复数个失真形式给予复数个补偿値,并针对每一该些失真形式提供一组补偿后之该修正资料向量;(b)该匹配装置(24)系用以找出该修正资料向量中匹配机率最大之一者,及其所用来补偿之该些失真形式;以及(c)推导装置(28)系以该组中匹配机率最大之该修正资料向量为基底求出该失真补偿量,该失真补偿量适用该补偿装置(22A,22B)来补偿该修正资料向量之该失真形式。2.如申请专利范围第1项所述之语音分析系统,适于将来自于复数个语音源之该失真形式进行语音分析,其中:(a)补偿装置(22A,22B)系针对每一该些语音源之该失真形式提供补偿后之该修正资料向量;(b)匹配装置(24)系将该模型分为一语音模型与一非语音模型,并找出该模型之该修正资料向量中匹配机率最大之该者;以及(c)推导装置(28)系藉由该语音模型之该修正资料向量算出该失真补偿量。3.如申请专利范围第2项所述之语音分析系统,可在该匹配装置中更新该非语音模型。4.如申请专利范围第1项所述之语音分析系统,可自具有个别之该失真形式之复数个语音源中辨识语音。5.如申请专利范围第1或4项所述之语音分析系统,可由分辨语音和杂讯,并在补偿时删去杂讯资料。6.如申请专利范围第1项所述之语音分析系统,该匹配装置(24)可依据先前匹配之情形,找出该修正资料向量中匹配机率最大之该者,以评估一资料向量列之匹配机率。7.如申请专利范围第1项所述之语音分析系统,其中该补偿装置(28)推导该失真补偿量之作法为:由该修正资料向量中匹配机率最大之该者及其所匹配之该模型得到一贡献値,将该贡献値与先前依此程序所得之一或复数个贡献値取平均而求得该失真补偿量。8.如申请专利范围第1项所述之语音分析系统,该语音之该资料向量系频率的函数。9.如申请专利范围第1项所述之语音分析系统,该匹配装置(24)系利用隐含式马可夫模型进行,而推导装置(28)系藉由模型状态参数的机率分布最大値而求出该失真补偿量。10.如申请专利范围第1项所述之语音分析系统,包括一产生资料向量之装置(18),其中该资料向量系由各频率区间之平均而得,其中(a)补偿装置(22A,22B)系对每该资料向量及每该具有各自失真形式之该补偿向量取纯量积而提供该组修正资料向量;(b)推导装置(28)系推导一更新后之该补偿向量,更新之内容系来自于每组中展现最大匹配机率之该修正资料向量之一第一贡献量,其所匹配之该模型之一估计向量和先前推导下一或复数个具有同样失真形式之贡献量。11.如申请专利范围第10项所述之语音分析系统,其中该失真形式与频道相关,亦即每该失真形式之该修正资料向量均经由各自频道传递以进行匹配程序。12.如申请专利范围第1项所述之语音分析系统,得避免执行与语音无关之补偿。13.如申请专利范围第12项所述之语音分析系统,该匹配装置(24)可分别使用于语音类和杂讯类之模型,且可指出每组展现最大匹配机率的修正资料向量的模型类别,该推导装置(28)和该补偿装置(22A,22B)得于以组合以避免执行杂讯类模型的补偿。14.一种语音分析系统,用以分析失真之一语音,包括下列步骤:(a)修正语音资料向量以补偿失真;(b)将修正资料向量与模型匹配;(c)推导并加入失真补偿;其特性为:i)步骤(a)系将每个资料向量加入复数个补偿値,以提供针对一失真形式补偿后的一组修正资料向量;ii)步骤(b)系找出每组中展现最大匹配机率的修正资料向量及其所补偿之该失真形式;以及iii)步骤(c)包括由每组中具有最大匹配机率之修正资料向量推导补偿量的一推导装置,用以补偿该补偿向量之该失真形式。15.如申请专利范围第14项所述之语音分析系统,其中该失真形式系与复数个语音源及杂讯有关。图式简单说明:第一图绘示本发明所提供之语音分析系统之方块图;以及第二图绘示如第一图所示的系统中,语音模型之状态参数。
地址 英国