发明名称 |
识别语音词汇的方法和系统 |
摘要 |
一种用于语音识别的声学信号处理的方法和装置,该方法包括下述部分:1)把每一音节分解成具有可比长度和复杂程度的两个音素,第一音素是前音元,第二音素是声调音元;2)给每一声调音元分配一声调值,像高、升、低、降和无声调;3)对前音元不分配声调值;4)连续检测音高并按照在一隐式马尔科夫模型中的能量和对数化倒频谱同样的方式处理以预测一声调音元的声调;5)一音节的声调定义为它的声调音元部分的声调。 |
申请公布号 |
CN1133974C |
申请公布日期 |
2004.01.07 |
申请号 |
CN96104212.5 |
申请日期 |
1996.02.29 |
申请人 |
国际商业机器公司 |
发明人 |
C·-J·J·陈;R·A·戈平纳思;M·D·蒙考斯基;M·A·皮希尼 |
分类号 |
G10L15/14 |
主分类号 |
G10L15/14 |
代理机构 |
中国专利代理(香港)有限公司 |
代理人 |
王勇;张志醒 |
主权项 |
1.一种识别包含至少一个具有声调成分的音节的语音词汇的方法,该方法包括下述步骤:把所述至少一个音节分解为前音元和声调音元,声调音元具有声调值;和根据所述至少一个音节的前音元和声调音元识别语音词汇包括以下步骤:连续检测所述至少一个音节的声调音元的音高值;根据检测的音高值,建立至少一个音高等值线;确定一个断续是否表示所述至少一个音节的无声调部分存在于邻接的音高等值线之间,如果是,生成至少一个模拟声调值以屏蔽该断续;从音高值和至少一个音高等值线的导数获得声调音元的参数;和使用该参数确定所述至少一个音节的声调音元的声调值。 |
地址 |
美国纽约 |