主权项 |
1.一种用以辨识语音字之方法,该等语音字包含具 有音调 内容之至少一音节,该方法包含下列步骤:区分该 至少一 音节成为一声素与一调素,该调素具有一音调値; 以及基 于该至少一音节之声素与调素来辨识语音字。2. 如申请专利范围第1项之方法,其中该辨识步骤包 括下 列步骤:连续地侦测该至少一音节之调素的一基频 値;基 于所侦测之基频値建立至少一基频轮廓;决定是否 在相邻 基频轮廓间存在一代表该至少一音节之一无音调 部分之不 连续,且若为此,则产生至少一模拟音调値以遮罩 该不连 续;由该调素之基频値及该至少一基频轮廓之一导 数获得 参数;以及使用该等参数决定该至少一音节之调素 的音调 値。3.如申请专利范围第1项之方法,其中该至少一 音节之声 素与调素具有大约相等之持续时间。4.如申请专 利范围第1项之方法,其中一音节之声素是代 表每一音节之一第一部份的一音素。5.如申请专 利范围第1项之方法,其中该至少一音节之调 素是一音素加上该音节之末端部份的音调。6.如 申请专利范围第5项之方法,该方法进一步包含:连 续侦测要加以辨识之输入语音基频;决定输入语音 之连续 调素的瞬间能量値;推导每一音框之多个倒频谱; 如果诸 音框之一之能量低于一临限値,则:利用一外插音 框来取 代该音框;建立包含倒频谱,瞬间能量与瞬间基频 做为参 数之特征向量空间以预测调素之音调。7.如申请 专利范围第5项之方法,其中该至少一音节之音 调値定义为该至少一音节调素之音调値。8.如申 请专利范围第1项之方法,其中该至少一音节之声 素的任何音调内容为了决定该至少一音节调素之 音调値之 故而受到忽略。9.如申请专利范围第1项之方法,进 一步包含利用该至少 一音节调素之音调来预测该至少一音节之音调。 10.一种用以辨识语音字之系统,该等语音字包含具 有音 调内容之至少一音节,该系统包含:用以区分该至 少一音 节成为一声素与一调素之装置,该调素具有一音调 値;以 及用以基于该至少一音节之声素与调素来辨识语 音字之装 置。11.如申请专利范围第10项之系统,其中该辨识 装置包含 :用以转换该等语音字为一电讯号之装置;取基频 装置, 若讯号能量高于一阀限値,则取得该至少一音节之 调素的 一基频値;用以外插该讯号之装置,其当该讯号能 量系低 于该阀限値或所取出之基频値不在一预定范围之 时,产生 一延伸基频讯号;储存装置,用以储存该延伸基频 讯号及 该延伸基频讯号之至少一导数;以及决定装置,其 使用该 储存资料来决定该至少一音节调素之音调値。12. 如申请专利范围第10项之系统,其中用以区分该至 少 一音节成为一声素与一调素之装置包含:一用以接 收该转 换装置之电讯号的类比/数位转换器;用以侦测该 至少一 音节之一开端与一末端之装置;用以指定该至少一 音节之 一第一部份成为该声素并用以指定该至少一音节 之一第二 部份成该调素之装置,该至少一音节之声素与调素 系具有 相当之持续时间。13.如申请专利范围第12项之系 统,其中使用一隐藏式马 可夫模型来表示该至少一音节之声素及调素。14. 如申请专利范围第2项之方法,其中该产生至少一 模拟 音调値以遮罩该不连续之步骤包含下列步骤:求得 该至少 一音节调素之音调値的对数;以及以一向游程平均 ( running average)衰减的指数来外插在该不连续处之该 至 少一基频轮廓,而该游程平均与一随机信号结合。 15.如申请专利范围第11项之系统,更包含一用以通 过该 延伸基频讯号之低频的低通滤波器。图式简单说 明:第一 图描写具有四种不同音调:低,上扬,下落,与高,之 音 节的连续语音基频轮廓。第二图描写示于第一图 之音节的 基频轮廓,并加入假信号以取代示于第一图之无基 频部份 。第三图展示五种音调:高,上场,下落,低与无音调 , 之基频/基频导数空间的轨迹。第四图是一国语音 节之隐 藏式马可夫模型的示意图。第五图是展示根据本 发明之声 素与调素之隐藏式马可夫模型的详细示意图。第 六图是根 据本发明之一系统的方块图。第七图是展示本发 明之基频 外插方法之细节的流程图。 |