使用音调化音素系统作语音辨识之统计音声处理方法与装置,申请号TW084104270-传众专利搜索

发明名称	使用音调化音素系统作语音辨识之统计音声处理方法与装置
摘要	一种用于语音辨识之音声信号处理的方法与装置，该方法包含下列步骤： (1)区分每一音节成为长度与复杂度相当之二音素，第一音素是声素(preme)，而第二音素是调素(toneme)；(2) 指定一值给每一调素，而该值可为例如高，上扬，低，下落，与无音调；(3) 不指定音调值给声素；(4) 以相同于一隐藏式马可夫模型之能量与倒频谱的方式来连续地侦测与处理基频以预测调素之音调；(5) 音节之音调定义为其之组成调素的音调。
申请公布号	TW369639	申请公布日期	1999.09.11
申请号	TW084104270	申请日期	1995.04.27
申请人	万国商业机器公司	发明人	C.朱利安.陈;拉米希.A.高平纳斯;麦可.A.皮奇尼;麦可.D.蒙克斯基
分类号	G06F15/38;G06F3/18	主分类号	G06F15/38
代理机构		代理人	陈长文台北巿敦化北路二○一号七楼
主权项	1.一种用以辨识语音字之方法,该等语音字包含具有音调内容之至少一音节,该方法包含下列步骤:区分该至少一音节成为一声素与一调素,该调素具有一音调値; 以及基于该至少一音节之声素与调素来辨识语音字。2. 如申请专利范围第1项之方法,其中该辨识步骤包括下列步骤:连续地侦测该至少一音节之调素的一基频値;基于所侦测之基频値建立至少一基频轮廓;决定是否在相邻基频轮廓间存在一代表该至少一音节之一无音调部分之不连续,且若为此,则产生至少一模拟音调値以遮罩该不连续;由该调素之基频値及该至少一基频轮廓之一导数获得参数;以及使用该等参数决定该至少一音节之调素的音调値。3.如申请专利范围第1项之方法,其中该至少一音节之声素与调素具有大约相等之持续时间。4.如申请专利范围第1项之方法,其中一音节之声素是代表每一音节之一第一部份的一音素。5.如申请专利范围第1项之方法,其中该至少一音节之调素是一音素加上该音节之末端部份的音调。6.如申请专利范围第5项之方法,该方法进一步包含:连续侦测要加以辨识之输入语音基频;决定输入语音之连续调素的瞬间能量値;推导每一音框之多个倒频谱; 如果诸音框之一之能量低于一临限値,则:利用一外插音框来取代该音框;建立包含倒频谱,瞬间能量与瞬间基频做为参数之特征向量空间以预测调素之音调。7.如申请专利范围第5项之方法,其中该至少一音节之音调値定义为该至少一音节调素之音调値。8.如申请专利范围第1项之方法,其中该至少一音节之声素的任何音调内容为了决定该至少一音节调素之音调値之故而受到忽略。9.如申请专利范围第1项之方法,进一步包含利用该至少一音节调素之音调来预测该至少一音节之音调。 10.一种用以辨识语音字之系统,该等语音字包含具有音调内容之至少一音节,该系统包含:用以区分该至少一音节成为一声素与一调素之装置,该调素具有一音调値;以及用以基于该至少一音节之声素与调素来辨识语音字之装置。11.如申请专利范围第10项之系统,其中该辨识装置包含 :用以转换该等语音字为一电讯号之装置;取基频装置, 若讯号能量高于一阀限値,则取得该至少一音节之调素的一基频値;用以外插该讯号之装置,其当该讯号能量系低于该阀限値或所取出之基频値不在一预定范围之时,产生一延伸基频讯号;储存装置,用以储存该延伸基频讯号及该延伸基频讯号之至少一导数;以及决定装置,其使用该储存资料来决定该至少一音节调素之音调値。12. 如申请专利范围第10项之系统,其中用以区分该至少一音节成为一声素与一调素之装置包含:一用以接收该转换装置之电讯号的类比/数位转换器;用以侦测该至少一音节之一开端与一末端之装置;用以指定该至少一音节之一第一部份成为该声素并用以指定该至少一音节之一第二部份成该调素之装置,该至少一音节之声素与调素系具有相当之持续时间。13.如申请专利范围第12项之系统,其中使用一隐藏式马可夫模型来表示该至少一音节之声素及调素。14. 如申请专利范围第2项之方法,其中该产生至少一模拟音调値以遮罩该不连续之步骤包含下列步骤:求得该至少一音节调素之音调値的对数;以及以一向游程平均 ( running average)衰减的指数来外插在该不连续处之该至少一基频轮廓,而该游程平均与一随机信号结合。 15.如申请专利范围第11项之系统,更包含一用以通过该延伸基频讯号之低频的低通滤波器。图式简单说明:第一图描写具有四种不同音调:低,上扬,下落,与高,之音节的连续语音基频轮廓。第二图描写示于第一图之音节的基频轮廓,并加入假信号以取代示于第一图之无基频部份。第三图展示五种音调:高,上场,下落,低与无音调 , 之基频/基频导数空间的轨迹。第四图是一国语音节之隐藏式马可夫模型的示意图。第五图是展示根据本发明之声素与调素之隐藏式马可夫模型的详细示意图。第六图是根据本发明之一系统的方块图。第七图是展示本发明之基频外插方法之细节的流程图。
地址	美国