发明名称 一种语音辨识方法及系统
摘要 一种语音辨识方法及系统,适用于辨识人所发出来的语音,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,应用本发明人所研发之辨识语音原则,以通用的语音文字对应资料库,来分析、判别语音所对应之表徵波形的物理特性,而能判断出语音所对应的文字、每个人语音的音色、以及语音的音调。语音辨识系统应用语音辨识原则,而将语音音包区分为子音、风声、以及母音部份,并对整个语音音包进行处理而取出首频、以及尾频,对子音、风声、以及母音部份分别进行辨识、处理、以及组合。将子音以及母音予以组合后,应用辨识语音原则,对由子音与母音所构成的语音以及通用的语音文字对应资料库进行比对,以得到发声者发出之语音所对应的文字为何。应用辨识语音原则,对整个语音音包的载波以及其上的调变锯齿波边缘,做分析处理而可得到语音的音色特征。应用辨识语音原则对整个语音音包的音量变化、音调高低进行分析、处理,而得出说话者的情绪反应,此情绪反应与语音音包的音量变化、音调高低有关。除了能利用子音以及母音的组合,而辨识出语音所对应的文字外,尚能利用首频、尾频的运算判断法则,配合母音部份之频率以及波形振幅外廓变化情形,辨识出中文语音中的四声变化。以子音以及母音的组合,加上中文语音中的四声变化,而得以正确地辨识出中文发音所对应的中文字。亦即,此语音辨识方法及系统除了可辨识出无四声变化的语音所对应的文字之外,例如无四声变化的西方文字语言,尚可辨识出具有四声变化的中文语音所对应出的中文字。
申请公布号 TW508564 申请公布日期 2002.11.01
申请号 TW089109312 申请日期 2000.05.16
申请人 封家麒 发明人 封家麒
分类号 G10L5/02 主分类号 G10L5/02
代理机构 代理人 陈昭诚 台北市博爱路八十号六楼
主权项 1.一种语音辨识方法,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识方法包含以下程序;(1)使用者所发出的语音经由处理而变成语音波形;(2)将语音波形之语音音包分为不同部份;(3)对语音音包的不同部份分别予以辨识;(4)将辨识出的子音以及母音进行组合,以判断出语音所对应的文字为何;以及(5)将结束此语音辨识过程。2.如申请专利范围第1项之语音辨识方法,其中,将语音波形之语音音包分为不同部份步骤,将语音波形之语音音包分为子音、风声、以及母音部份。3.如申请专利范围第2项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。4.如申请专利范围第2项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。5.如申请专利范围第2.3或4项之语音辨识方法,其中,对语音音包的不同部份分别予以辨识步骤,将对母音部份含有重复出现的音包波形区域进行切割,对语音波形之子音部份以及母音部份予以辨识。6.一种语音辨识方法,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识方法包含以下程序;(1)将使用者所发出的语音讯号转变为所对应的表徵波形,将语音讯号先经由处理而变成语音波形;(2)经由分析、利用语音的表徵波形物理特性,取出此波形的各项特征参数;(3)依此波形的各项特征参数,来辨识出子音、风声、以及母音的特征,而将语音所对应的波形区分为子音、风声、以及母音部份;(4)待将波形区分为子音、风声、以及母音部份后,针对子音以及母音所具有的波形特征进行判断、分析,而得出子音部份所对应的文字子音为何,以及母音部份所对应的文字母音为何;(5)组合所辨识出的文字子音以及文字母音,并得出组合之语音所代表对应的文字为何;以及(6)结束此语音辨识过程。7.如申请专利范围第6项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。8.如申请专利范围第6项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。9.如申请专利范围第6.7或8项之语音辨识方法,其中,针对子音以及母音所具有的波形特征进行判断、分析,将对母音部份含有重复出现的音包波形区域进行切割。10.一种语音辨识方法,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识方法包含以下程序;(1)使用者所发出的语音经由处理而变成语音波形;(2)将语音波形之语音音包分为不同部份,并对整个音包选取首频以及尾频;(3)对语音音包的不同部份分别予以辨识,并利用首频、尾频的运算判断法则,辨识出语音中的声调变化;(4)将辨识出的子音、母音、以及声调变化进行组合,以判断出语音所对应的文字为何;以及(5)将结束此语音辨识过程。11.如申请专利范围第10项之语音辨识方法,其中,将语音波形之语音音包分为不同部份步骤,将语音波形之语音音包分为子音、风声、以及母音部份。12.如申请专利范围第11项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。13.如申请专利范围第11项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。14.如申请专利范围第11.12或13项之语音辨识方法,其中,对语音音包的不同部份分别予以辨识并利用首频、尾频的运算判断法则,辨识出语音中的声调变化的步骤,将对母音部份含有重复出现的音包波形区域进行切割,对语音波形之子音部份以及母音部份予以辨识。15.如申请专利范围第11项之语音辨识方法,其中,将语音波形之语音音包分为不同部份,并对整个音包选取首频以及尾频步骤,对整个语音音包的前1/4选取平均频率做为首频、并对整个语音音包的后1/4选取平均频率做为尾频。16.如申请专利范围第15项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。17.如申请专利范围第15项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。18.如申请专利范围第15.16或17项之语音辨识方法,其中,对语音音包的不同部份分别予以辨识并利用首频、尾频的运算判断法则,辨识出语音中的声调变化的步骤,将对母音部份含有重复出现的音包波形区域进行切割,对语音波形之子音部份以及母音部份予以辨识。19.一种语音辨识方法,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识方法包含以下程序;(1)将使用者所发出的语音讯号转变为所对应的表徵波形,将语音讯号先经由处理而变成语音波形;(2)经由分析、利用语音的表徵波形物理特性,取出此波形的各项特征参数,并对整个音包选取首频以及尾频;(3)依此波形的各项特征参数,来辨识出子音、风声、以及母音的特征,而将语音所对应的波形区分为子音、风声、以及母音部份;(4)待将波形区分为子音、风声、以及母音部份后,针对子音以及母音所具有的波形特征进行判断、分析,而得出子音部份所对应的文字子音为何,以及母音部份所对应的文字母音为何,并利用首频、尾频的运算判断法则,辨识出语音中的声调变化;(5)将辨识出的子音、母音、以及声调变化进行组合,以判断出语音所对应的文字为何;以及(6)结束此语音辨识过程。20.如申请专利范围第19项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。21.如申请专利范围第19项之语音辨识方法,其中,将语音波形之语音音包分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。22.如申请专利范围第19.20或21项之语音辨识方法,其中,针对子音以及母音所具有的波形特征进行判断、分析,将对母音部份含有重复出现的音包波形区域进行切割。23.如申请专利范围第19项之语音辨识方法,其中,经由分析、利用语音的表徵波形物理特性,取出此波形的各项特征参数,并对整个音包选取首频以及尾频步骤,对整个语音音包的前1/4选取平均频率做为首频、并对整个语音音包的后1/4选取平均频率做为尾频。24.如申请专利范围第19项之语音辨识方法,其中,依此波形的各项特征参数,来辨识出子音、风声、以及母音的特征,而将语音所对应的波形区分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,风声部份的频率比子音以及母音部份高出许多。25.如申请专利范围第19项之语音辨识方法,其中,依此波形的各项特征参数,来辨识出子音、风声、以及母音的特征,而将语音所对应的波形区分为子音、风声、以及母音部份步骤,子音部份之波形可为渐近音,爆擦音,挤压音,或爆发音,母音部份含有重复出现的音包波形区域,母音部份的组成特征参数包含转折数、波数、以及斜率,风声部份的频率比子音以及母音部份高出许多。26.如申请专利范围第23.24或25项之语音辨识方法,其中,对语音音包的不同部份分别予以辨识并利用首频、尾频的运算判断法则,辨识出语音中的声调变化的步骤,将对母音部份含有重复出现的音包波形区域进行切割,对语音波形之子音部份以及母音部份予以辨识。27.如申请专利范围第10.11.12.13.15或16项所述之语音辨识方法,乃应用于辨识中文语音。28.如申请专利范围第17.19.20或21项所述之语音辨识方法,乃应用于辨识中文语音。29.如申请专利范围第23.24或25项所述之语音辨识方法,乃应用于辨识中文语音。30.一种语音辨识系统,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识系统包含;语音辨识原则资料库,此语音辨识原则资料库中包含辨识语音原则,此些语音辨识原则用来对语音音包进行处理,将语音音包区分为子音、风声、以及母音部份,并对子音、风声、以及母音部份分别进行辨识,以判断出子音以及母音为何,并将辨识出的子音、母音部份予以组合,并将所得出的语音组合与语音文字对应资料库进行比对,以得出语音所对应的文字为何;语音文字对应资料库,此通用的语音文字对应资料库则包含语音所对应的文字资料库,语音由子音、母音所组合而成,语音具有相对应的文字,语音与文字互相对应,组合语音而得出所发出的语音所代表的文字;语音转换处理模组,此语音转换处理模组是用以将使用者所发出的语音转变为所对应之物理表徵波形讯号,并将此讯号输入到语音辨识模组以供做语音辨识处理;以及语音辨识处理模组,此语音辨识处理模组则根据语音辨识原则资料库中的辨识语音原则,而对此波形讯号进行处理,将语音音包区分为子音、风声、以及母音部份,语音辨识处理模组并根据辨识语音原则,对语音音包进行子音、风声、以及母音部份分别进行辨识、处理、以及组合,语音辨识处理模组将辨识出的子音、母音部份予以组合,并将所得出的语音组合与通用的语音文字对应资料库进行比对,以得出语音所对应的文字为何。31.一种语音辨识系统,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识系统包含;语音辨识原则资料库,此语音辨识原则资料库中包含辨识语音原则,此些语音辨识原则用来对语音音包进行处理,将语音音包区分为子音、风声、以及母音部份,并取出语音音包的首频、以及尾频,利用语音辨识原则对子音、风声、以及母音部份分别进行辨识,以判断出子音以及母音为何,语音辨识原则并以首频、尾频的运算判断法则,配合母音部份之频率以及波形振幅外廓变化情形,而辨识出中文语音中的四声变化,语音辨识原则并可将辨识出的子音、母音部份,亦或子音、母音部份、以及四声变化予以组合,并将所得出的语音组合与语音文字对应资料库进行比对,以得出语音所对应的文字为何;语音文字对应资料库,此通用的语音文字对应资料库则包含语音所对应的文字资料库,语音由子音、母音,亦或由子音、母音、以及四声变化所组合而成,语音具有相对应的文字,语音与文字互相对应,组合语音而得出所发出的语音所代表的文字;语音转换处理模组,此语音转换处理模组是用以将使用者所发出的语音转变为所对应之物理表徵波形讯号,并将此讯号输入到语音辨识模组以供做语音辨识处理;以及语音辨识处理模组,此语音辨识处理模组则根据语音辨识原则资料库中的辨识语音原则,而对此波形讯号进行处理,将语音音包区分为子音、风声、以及母音部份,并将对语音音包进行处理而取出首频、以及尾频,语音辨识处理模组并根据辨识语音原则,对语音音包进行子音、风声、以及母音部份分别进行辨识、处理、以及组合,语音辨识处理模组将辨识出的子音、母音部份,亦或子音、母音部份、以及四声变化予以组合,并将所得出的语音组合与通用的语音文字对应资料库进行比对,以得出语音所对应的文字为何。32.一种语音辨识系统,在无须事先建立每个人专属之个人语音与文字的对应资料库情形下,利用辨识语音原则以及通用的语音文字对应资料库,来辨识语音,此语音辨识系统包含;语音辨识原则资料库,此语音辨识原则资料库中包含辨识语音原则,此些辨识语音原则包含区分语音音包为子音、风声、以及母音部份的规则、取出语音音包首频以及尾频的规则、辨识子音、风声、以及母音的规则、辨识四声变化的规则、组合子音与母音的规则、组合子音母音与四声变化的规则、辨识语音音包音色的规则、以及辨识语音音包音量变化的规则,此些语音辨识原则用来对语音音包进行处理,将语音音包区分为子音、风声、以及母音部份,并取出语音音包的首频、以及尾频,利用语音辨识原则对子音、风声、以及母音部份分别进行辨识,以判断出子音以及母音为何,语音辨识原则并以首频、尾频的运算判断法则,配合母音部份之频率以及波形振幅外廓变化情形,而辨识出中文语音中的四声变化,语音辨识原则并可将辨识出的子音、母音部份,亦或子音、母音部份、以及四声变化予以组合,并将所得出的语音组合与语音文字对应资料库进行比对,以得出语音所对应的文字为何;语音文字对应资料库,此通用的语音文字对应资料库则包含语音所对应的文字资料库,语音由子音、母音,亦或由子音、母音、以及四声变化所组合而成,语音具有相对应的文字,语音与文字互相对应,组合语音而得出所发出的语音所代表的文字;语音转换处理模组,此语音转换处理模组是用以将使用者所发出的语音转变为所对应之物理表徵波形讯号,并将此讯号输入到语音辨识模组以供做语音辨识处理;以及语音辨识处理模组,此语音辨识处理模组则根据语音辨识原则资料库中的辨识语音原则,而对此波形讯号进行处理,将语音音包区分为子音、风声、以及母音部份,并将对语音音包进行处理而取出首频、以及尾频,语音辨识处理模组并根据辨识语音原则,对语音音包进行子音、风声、以及母音部份分别进行辨识、处理、以及组合,语音辨识处理模组将辨识出的子音、母音部份,亦或子音、母音部份、以及四声变化予以组合,并将所得出的语音组合与通用的语音文字对应资料库进行比对,以得出语音所对应的文字为何。33.如申请专利范围第30.31或32项之语音辨识系统,其中,该语音辨识处理模组为电脑主机。34.如申请专利范围第30.31或32项之语音辨识系统,其中,该语音辨识处理模组为电脑主机,且语音辨识原则资料库、以及语音文字对应资料库储存于电脑之记忆装置内。图式简单说明:第1图为一系统方块图,其中显示应用本发明之语音辨识方法及系统的系统基本组织架构之方块模组图;第2图为表示第1图之语音辨识系统的运作流程图,其中显示应用本发明之语音辨识系统进行语音辨识方法,以对语音进行辨识之工作原理的流程程序;第3图为表示第1图之语音辨识系统的运作流程图,其中显示应用本发明之语音辨识系统进行语音辨识方法,以进行语音辨识、音色、以及发音情緖判断处理之工作原理的流程程序;第4图为一运作流程图,用以更详细地解释于第3图中之对语音进行辨识之工作原理的流程程序;第5图为一运作流程图,用以更详细地解释于第3图中之对语音进行语音辨识、音色、以及发音情緖判断处理之工作原理的流程程序;第6图为一运作流程图,用以更详细地解释于第4图中之辨识出使用者所发出之中文语音所对应的文字之工作原理的流程程序;第7(a)图为一示意图,用以解释语音波形的组成特性结构;第7(b)图为一示意图,用以解释子音、风声、以及母音部份;第7(c)图为一示意图,用以解释于第7(b)图中子音区的爆发音的波形特性;第7(d)图为一示意图,用以解释于第7(b)图中子音区的爆擦音的波形特性;第8图为一示意图,用以解释于第7(b)图中之语音波形之母音部份的组成特性结构;第9图为一示意图,用以解释于第7(b)图中之语音波形之母音部份的组成特征参数;第10图为一示意图,为关于中文四声声调变化的声调频率统计;以及第11图为一示意图,用以说明[巴]字的子音以及母音部份的波形,并应用辨识语音原则进行识别。
地址 澳门