发明名称 大量人群中快速且详细匹配之语音者辨识
摘要 将快速的及详细的语音者辨识之匹配技术合并使用而成的一种混合系统,其中当有一个登录之中的语音者与先前登录的语音者有可能造成潜在的混淆时,就将他们组合成一群。因此,详细匹配技术是只在快速匹配技术可能会产生饱和的状况下才使用,详细匹配技术的有利处是限制在群组内做比对,且其发展出的语音者相关模式之主要功能在于识别出群组中的成员,而不是完整地辨别每个语音者的特性。因此储存量之计算需求都被限制住,而快速及准确的语音者辨识也可拓展于更多的语音者数量,并不会造成快速匹配系统的性能下降或饱和,也不会造成详细匹配系统的功能下降。
申请公布号 TW374895 申请公布日期 1999.11.21
申请号 TW086118791 申请日期 1997.12.12
申请人 万国商业机器公司 发明人 史帝芬尼赫曼梅斯
分类号 G10L5/06 主分类号 G10L5/06
代理机构 代理人 陈长文
主权项 1.一种辨识语音者的方法,其包含的步骤为:形成一些群的登录语音者;在该些群登录的语音者中,识别出最有可能包含一特定语音者语调的一个语音者或一群语音者;及该语调与该群语音者内的语音者相关模式加以匹配,以决定该语调的一语音者之特质。2.如申请专利范围第1项之方法,其中的识别出一群的该步骤进一步包含底下的步骤:将该语音者的语调做一暂时的识别。3.如申请专利范围第1项之方法,其中的该识别之方法至少包含有一步骤:验证该语调的语音者是否可能是该先前识别步骤所识别出的语音者。4.如申请专利范围第1项之方法,其中的形成这些群的该步骤包含有进一步的步骤如下:在将新语音者登录而形成一个码册时,以分群的特性向量来表示该新语音者的语调;将该特性向量针对先前登录语音者的码册予以解码;当侦测到该新语音者与该先前登录的语音者有可能混淆时,就将该新语音者及先前登录的语音者合成一个群。5.如申请专利范围第4项之方法,包含有底下进一步的步骤:发展一种语音者相关的模式使其具有辨识出一群内的不同语音者的能力。6.如申请专利范围第1项之方法,其中的该匹配步骤是内容相关的。7.如申请专利范围第2项之方法,其中的该暂时识别包含有底下进一步之步骤:决定出至少有两个备选的语音者以便被辨识;及选择最有可能的备选语音者,假如备选的语音者不是属于一个类群的话。8.如申请专利范围第2项之方法,其中的该暂时之识别包含有底下进一步之步骤:决定出至少三个的备选语音者以便做辨识,将至少有两个且小于所有的该至少三个的语音者相连为一个类群;及将与该类群不相连的该至少三个备选语音者中的一个备选语音者予以删除。9.如申请专利范围第1项之方法,其中的该识别一个语音者或一群语音者的语调匹配之该步骤是以阶层的方式加以执行。10.如申请专利范围第3项之方法,其中的该确认步骤包含底下的步骤:决定出该语调的语音者与该先前识别出的语音者是属于同一个类群。11.如申请专利范围第10项之方法,包含有底下进一步之步骤:重复该匹配步骤以完成该确认步骤。12.如申请专利范围第1项之方法,包含有底下进一步之步骤:经由重复至少一次该识别步骤以进一步确认该识别步骤或该匹配步骤所识别出的语音者语调是否为该语音者。13.如申请专利范围第12项之方法,包含有底下之进一步步骤:决定出一群语音者之成员中若不包含由该识别步骤或该匹配步骤所识别出进一步语调之语音者之可能性値是否大于由该识别或该匹配步骤所识别出的该进一步语调之语音者之可能性质;若是则终止并宣告该确认步骤失败。14.如申请专利范围第9项之方法,其中的该识别步骤是以向量分群的方式加以执行。15.如申请专利范围第9项之方法,其中的该匹配步骤之执行是藉由使用一个训练过的语音者相关模式而解码该语调,其识别语音者的方式是由其所训练出的最有可能性之模式。16.一种语音者辨识的装置,包含有用以取样语调框并决定该个别语调框的最有可能语音者之装置,用以取样之该装置包含有用以侦测该语调语音者与一个或多个先前登录语音者有可能混淆之装置;及用以发展出一个语音者相关模式之装置,该语音者相关模式用以回应该侦测可能混淆之装置而辨识出该语音者及该先前登录的语音者。17.如申请专利范围第16项之装置,进一步包含有:回应该侦测出可能混淆之装置而形成一群语音者的装置;及回应该取样装置而将语调针对有限数目之群的语音者相关模式加以匹配的装置。18.如申请专利范围第16项之装置,其中的该取样装置包含有:登录一个新语音者的装置。图式简单说明:第一图之方块流程图是本发明较佳形式的架构及操作图。第二图A及第二图B是根据本发明处理之长条图说明。
地址 美国