发明名称 感测器式语音辨识器选择、适应及合并
摘要 本发明系关于电脑化语音辨识之领域。详言之,其系关于操作一语音辨识系统之方法及相关系统,在该方法中,为了有效地改善由单个辨识器所进行的语音辨识的结果,可存取以启动复数个辨识器程式用于语音辨识,并根据每次的需要将程式进行合并。为了使这类系统适应各种操作环境之发生动态改变的声音条件,并适应在仅具有有限计算能力的嵌入式系统中运行的特别要求,建议a)使用感测器构件收集表现语音辨识边界条件(例如说话者与环境噪音等)特征的(210、220、230、240)选择基础资料;b)使用用于对所收集之资料进行评估的(260)程式控制判定器构件(例如一包括软体机制之判定引擎及一实体感测器),在复数个可获得之辨识器中选择(290)最适合的辨识器或其组合。
申请公布号 TWI245259 申请公布日期 2005.12.11
申请号 TW092130316 申请日期 2003.10.30
申请人 万国商业机器公司 发明人 法克 费奇;西格佛瑞德 古兹曼
分类号 G10L15/22 主分类号 G10L15/22
代理机构 代理人 陈长文 台北市松山区敦化北路201号7楼
主权项 1.一种操作一语音辨识系统之方法,其中一程式控制辨识器(1)执行以下步骤:将一语音讯号分割成多个讯框,并计算用于各讯框的任何种类之特点向量,藉由按每音素产生复数个标记的字元或字元群来标记多个讯框,根据一预定声音模型对该等标记进行解码,以建构一个或多个字或者一个字的多个片段,在该方法中,可存取以启动复数个辨识器用于语音辨识,并将该等辨识器进行合并以平衡由单个辨识器所进行的语音辨识的该等结果,其特征在于以下步骤:a)使用感测器构件(5)收集表现语音辨识边界条件特征的(210、220、230、240)选择基础资料;b)使用(260)程式控制判定器构件(6),用于评估该所收集之资料的;c)根据该评估在该等复数个可获得之辨识器中选择(290)该最适合的辨识器或其一组合。2.如申请专利范围第1项之方法,其中该等感测器构件(5)为下列构件中的一个或多个:一包括软体程式之判定逻辑、实体感测器或其一组合。3.如申请专利范围第1项之方法,还包括以下步骤:a)在一实施统计试验法、判定树法、模糊成员资格函数法中的一个或多个的判定逻辑中,处理(260)一实体感测器(5)之输出;b)自该程序传回(270)一待在该感测器选择/合并判定中使用的可靠値。4.如申请专利范围第1项之方法,其中将已引起一辨识器选择判定的选择基础资料储存在一用于对其进行重复、快速存取(250)的资料库中,以便辨识器进行一快速选择。5.如申请专利范围第1项之方法,还包括以下步骤:根据(280)该当前之处理器负载选择(290)辨识器之该数目及/或该合并方式。6.如申请专利范围第1项之方法,还包括以下步骤:储存该表示一声音模型如何被转换为另一个模型之对应规则(7),以代替储存复数个模型本身。7.一种具有用于执行根据前述之申请专利范围第1至6项中的其中一项的一方法的该等步骤的构件之电脑系统。8.一种电脑可用媒体,包含一在一资料处理系统中执行的电脑程式,该电脑程式包含电脑程式码部分,当该等电脑程式码部分在一电脑上执行时,它们用于执行该根据前述之申请专利范围第1至6项中的任何一项的方法的相应步骤。9.一种被储存在一包括电脑可读程式构件的电脑可用媒体上的电脑程式产品,当该电脑程式产品在一电脑上执行时,它用于使一电脑执行如申请专利范围第1至6项中的任何一项的该方法。图式简单说明:图1为一示意性的典型方块图,其根据本发明之一较佳实施例提供对本发明概念之概述,图2为一示意性的典型方块图,其以远距传输领域内、应用于汽车的嵌入式系统中的例示性应用提供对本发明之基本概念之概述。
地址 美国