发明名称 使用音调化音素系统作语音辨识之统计音声处理方法与装置
摘要 一种用于语音辨识之音声信号处理的方法与装置,该方法包含下列步骤: (1)区分每一音节成为长度与复杂度相当之二音素,第一音素是声素(preme), 而第二音素是调素(toneme);(2) 指定一值给每一调素,而该值可为例如高,上扬,低,下落,与无音调;(3) 不指定音调值给声素;(4) 以相同于一隐藏式马可夫模型之能量与倒频谱的方式来连续地侦测与处理基频以预测调素之音调;(5) 音节之音调定义为其之组成调素的音调。
申请公布号 TW369639 申请公布日期 1999.09.11
申请号 TW084104270 申请日期 1995.04.27
申请人 万国商业机器公司 发明人 C.朱利安.陈;拉米希.A.高平纳斯;麦可.A.皮奇尼;麦可.D.蒙克斯基
分类号 G06F15/38;G06F3/18 主分类号 G06F15/38
代理机构 代理人 陈长文 台北巿敦化北路二○一号七楼
主权项 1.一种用以辨识语音字之方法,该等语音字包含具 有音调 内容之至少一音节,该方法包含下列步骤:区分该 至少一 音节成为一声素与一调素,该调素具有一音调値; 以及基 于该至少一音节之声素与调素来辨识语音字。2. 如申请专利范围第1项之方法,其中该辨识步骤包 括下 列步骤:连续地侦测该至少一音节之调素的一基频 値;基 于所侦测之基频値建立至少一基频轮廓;决定是否 在相邻 基频轮廓间存在一代表该至少一音节之一无音调 部分之不 连续,且若为此,则产生至少一模拟音调値以遮罩 该不连 续;由该调素之基频値及该至少一基频轮廓之一导 数获得 参数;以及使用该等参数决定该至少一音节之调素 的音调 値。3.如申请专利范围第1项之方法,其中该至少一 音节之声 素与调素具有大约相等之持续时间。4.如申请专 利范围第1项之方法,其中一音节之声素是代 表每一音节之一第一部份的一音素。5.如申请专 利范围第1项之方法,其中该至少一音节之调 素是一音素加上该音节之末端部份的音调。6.如 申请专利范围第5项之方法,该方法进一步包含:连 续侦测要加以辨识之输入语音基频;决定输入语音 之连续 调素的瞬间能量値;推导每一音框之多个倒频谱; 如果诸 音框之一之能量低于一临限値,则:利用一外插音 框来取 代该音框;建立包含倒频谱,瞬间能量与瞬间基频 做为参 数之特征向量空间以预测调素之音调。7.如申请 专利范围第5项之方法,其中该至少一音节之音 调値定义为该至少一音节调素之音调値。8.如申 请专利范围第1项之方法,其中该至少一音节之声 素的任何音调内容为了决定该至少一音节调素之 音调値之 故而受到忽略。9.如申请专利范围第1项之方法,进 一步包含利用该至少 一音节调素之音调来预测该至少一音节之音调。 10.一种用以辨识语音字之系统,该等语音字包含具 有音 调内容之至少一音节,该系统包含:用以区分该至 少一音 节成为一声素与一调素之装置,该调素具有一音调 値;以 及用以基于该至少一音节之声素与调素来辨识语 音字之装 置。11.如申请专利范围第10项之系统,其中该辨识 装置包含 :用以转换该等语音字为一电讯号之装置;取基频 装置, 若讯号能量高于一阀限値,则取得该至少一音节之 调素的 一基频値;用以外插该讯号之装置,其当该讯号能 量系低 于该阀限値或所取出之基频値不在一预定范围之 时,产生 一延伸基频讯号;储存装置,用以储存该延伸基频 讯号及 该延伸基频讯号之至少一导数;以及决定装置,其 使用该 储存资料来决定该至少一音节调素之音调値。12. 如申请专利范围第10项之系统,其中用以区分该至 少 一音节成为一声素与一调素之装置包含:一用以接 收该转 换装置之电讯号的类比/数位转换器;用以侦测该 至少一 音节之一开端与一末端之装置;用以指定该至少一 音节之 一第一部份成为该声素并用以指定该至少一音节 之一第二 部份成该调素之装置,该至少一音节之声素与调素 系具有 相当之持续时间。13.如申请专利范围第12项之系 统,其中使用一隐藏式马 可夫模型来表示该至少一音节之声素及调素。14. 如申请专利范围第2项之方法,其中该产生至少一 模拟 音调値以遮罩该不连续之步骤包含下列步骤:求得 该至少 一音节调素之音调値的对数;以及以一向游程平均 ( running average)衰减的指数来外插在该不连续处之该 至 少一基频轮廓,而该游程平均与一随机信号结合。 15.如申请专利范围第11项之系统,更包含一用以通 过该 延伸基频讯号之低频的低通滤波器。图式简单说 明:第一 图描写具有四种不同音调:低,上扬,下落,与高,之 音 节的连续语音基频轮廓。第二图描写示于第一图 之音节的 基频轮廓,并加入假信号以取代示于第一图之无基 频部份 。第三图展示五种音调:高,上场,下落,低与无音调 , 之基频/基频导数空间的轨迹。第四图是一国语音 节之隐 藏式马可夫模型的示意图。第五图是展示根据本 发明之声 素与调素之隐藏式马可夫模型的详细示意图。第 六图是根 据本发明之一系统的方块图。第七图是展示本发 明之基频 外插方法之细节的流程图。
地址 美国