发明名称 语音辨识方法与系统
摘要 语音辨识的方法与系统包含接收反映语音的资讯,决定接收资讯的至少一个粗分类,根据决定的粗分类将接收资讯分类,根据接收资讯的分类选择一个模型,并且使用选择的模型与接收资讯辨识语音。
申请公布号 TW574684 申请公布日期 2004.02.01
申请号 TW091121521 申请日期 2002.09.19
申请人 财团法人工业技术研究院 发明人 洪维廷
分类号 G10L15/16 主分类号 G10L15/16
代理机构 代理人
主权项 1.一种用于语音辨识的方法,包含:反映该语音的接收资讯;决定该接收资讯的至少一种以上的粗分类;依该决定的粗分类来分类该接收资讯;选择依该接收资料的分类为基础的一模型;以及辨识使用该选择模型和该接收资讯的该语音。2.如申请专利第1项之用于语音辨识的方法,其中该接收资讯包含选取特征资讯。3.如申请专利第2项之用于语音辨识的方法,其中该选取特征资讯包含至少频谱特征资讯、时间特征资讯和统计特征资讯的其中之一。4.如申请专利第1项之用于语音辨识的方法,其中该决定的粗分类是选自最初粗分类、最终粗分类和非语音粗分类。5.如申请专利第1项之用于语音辨识的方法,其中该接收资讯包含反映至少该语音的一个音框的资讯,其中决定该接收资讯的该粗分类包含决定该音框的一粗分类,以及其中分类该接收资讯于如果该音框的该粗分类为一最初粗分类时不使用该音框。6.如申请专利第1项之用于语音辨识的方法,其中该接收资讯包含反映至少该语音的一个音框的资讯,其中决定该接收资讯的该粗分类包含决定该音框的一粗分类,以及其中分类该接收资讯于如果该音框的该粗分类为一最终粗分类时不使用该音框。7.如申请专利第1项之用于语音辨识的方法,其中该接收资讯的该分类包含至少一通道分类、一环境分类及一讲话者分类的其中之一。8.如申请专利第7项之用于语音辨识的方法,其中该通道分类包含至少无线通道分类和有线通道分类的其中之一。9.如申请专利第7项之用于语音辨识的方法,其中该环境分类包含至少一安静办公室分类、公共场所分类及行驶车辆中分类的其中之一。10.如申请专利第1项之用于语音辨识的方法,其中该选择模型为隐藏式马可夫模型。11.如申请专利第1项之用于语音辨识的方法,其中一递回式类神经网路决定该接收资讯的该粗分类。12.如申请专利第1项之用于语音辨识的方法,其中一递回式类神经网路分类该接收资讯。13.一种语音辨识的系统,包含;一接收反应语音资讯的接受器;一第一递回式类神经网路,用以决定该接收资讯至少一种粗分类;一第二递回式类神经网路,用以基于该决定的粗分类而分类的该接收资讯;一模型选择器,用以选择一基于该接收资讯的分类而选择的一隐藏式马可夫模型;以及一辨识器,用以辨识使用该隐藏式马可夫模型和该接收资讯的该语音。14.如申请专利第13项之语音辨识的系统,其中该接收资讯包含选取特征资讯。15.如申请专利第13项之语音辨识的系统,其中该选取特征资讯包含至少频谱特征资讯、时间特征资讯和统计特征资讯的其中之一。16.如申请专利第13项之语音辨识的系统,其中该决定的粗分类是选自最初粗分类、最终粗分类和非语音粗分类。17.如申请专利第13项之语音辨识的系统,其中该接收资讯包含反映至少该语音的一个音框的资讯,其中该第一递回式类神经网路决定该音框的一粗分类,以及其中第二递回式类神经网路于如果该音框的该粗分类为一最初粗分类时不使用该音框。18.如申请专利第13项之语音辨识的系统,其中该接收资讯包含反映至少该语音的一个音框的资讯,其中该第一递回式类神经网路决定该音框的一粗分类,以及其中第二递回式类神经网路于如果该音框的该粗分类为一最终粗分类时不使用该音框。19.如申请专利第13项之语音辨识的系统,其中该接收资讯的该分类包含至少一通道分类、一环境分类及一讲话者分类的其中之一。20.如申请专利第19项之语音辨识的系统,其中该通道分类包含至少无线通道分类和有线通道分类的其中之一。21.如申请专利第19项之语音辨识的系统,其中该环境分类包含至少一安静办公室分类、公共场所分类及行驶车辆中分类的其中之一。22.一种含有一电脑执行步骤操作指示电脑可读媒体的方法,其步骤为:反映该语音的接收资讯;决定该接收资讯的至少一种以上的粗分类;依决定的粗分类来分类该接收资讯;选择依该接收资料的分类为基础的一模型;以及辨识使用该选择模型和该接收资讯的该语音。图式简单说明:第一图系为说明一个符合本发明的特性与原理的语音辨识的示范系统;第二图系为说明一个符合本发明的特性与原理的语音辨识的示范方法;以及第三图系为说明一个符合本发明的特性与原理的递回式类神经网路。
地址 新竹县竹东镇中兴路四段一九五号