发明名称 |
语音识别系统 |
摘要 |
一个汉语普通话语音识别系统包括预处理装置(32),HMM存储装置(34),语音辨识装置(36)和语音决策装置(38)。语音辨识装置包括表示在单独韵母构成音节之前的声门闭塞的伪声母。HMM存储装置存储构成汉语普通话语音音节的声母、韵母和伪声母的上下文相关模型。这些模型可能依赖于相应的声母或韵母以及音节的音调。语音决策装置按照语音辨识装置中的音节连接声母和韵母以及伪声母和韵母。然后语音决策装置比较音节的输入信号和连接模型来决定音节的语音结构和音节的音调。该系统还包括用来平滑模型以使识别更具鲁棒性的平滑装置(42)。该平滑装置包括LDM产生装置(46)和细化模型修正装置(48)。 |
申请公布号 |
CN1277248C |
申请公布日期 |
2006.09.27 |
申请号 |
CN200410004068.3 |
申请日期 |
1996.01.23 |
申请人 |
苹果电脑公司 |
发明人 |
H·W·康;B·S·袁 |
分类号 |
G10L15/02(2006.01);G10L15/06(2006.01) |
主分类号 |
G10L15/02(2006.01) |
代理机构 |
中国专利代理(香港)有限公司 |
代理人 |
陈景峻 |
主权项 |
1.一个用于识别一种语言的音节的语音识别系统,每个该语言的音节由一个声母子音节和一个韵母子音节组成,该语音识别系统包括:一个语音辨识装置,用来存储多个声母子音节和韵母子音节的合法组合并且用于为声母子音节和韵母子音节的每个合法组合产生合法音节信号;一个存储装置,用来存储多个声母子音节模型和多个韵母子音节模型;预处理器,用于接收数字化音节的输入信号并且处理该数字化音节供识别之用;以及一个语音决策装置,它用来接收:经第一输入来的一个待识别的输入信号;经第二输入来自语音辨识装置的多个合法组合;以及经第三输入来自存储装置的多个模型;处理每个合法的音节信号;提取和每个被辨识的声母子音节对应的模型信号,并且辨识每个合法音节信号的韵母子音节;比较每个被提取的模型信号和输入信号;通过选择最佳匹配于输入信号的模型信号,产生辨识该最佳匹配于输入信号的模型信号的信号;以及产生辨识所述语言的音节的信号;其中,在语音决策装置接收到输入信号、所述多个合法组合以及所述多个模型之后,语音决策装置根据所接收的多个合法组合从所接收的多个模型中产生附加模型,每个附加的模型包括添加到声母子音节尾部的韵母子音节模型,把每个附加的模型与输入信号相比较,然后产生并输出一个表明与输入信号最佳匹配的一个附加模型的信号。 |
地址 |
美国加利福尼亚州 |