发明名称 具有巨大词汇量的语音识别系统
摘要 本发明涉及语音识别,例如用于识别连续语音中的单词的系统。所公开的语音识别系统能够识别大量的单词,在原理上甚至能够识别无限量的单词。所述语音识别系统包括单词识别器,其通过单词图导出最佳路径,其中,基于最佳路径把单词分配给语音。单词分值是通过将音素语言模型应用于单词图的每个单词而获得的。此外,本发明涉及根据声音块识别单词的装置和方法,还涉及用于实现所述方法的计算机可读代码。
申请公布号 CN101326572B 申请公布日期 2011.07.06
申请号 CN200680046025.9 申请日期 2006.12.06
申请人 纽昂斯奥地利通讯有限公司 发明人 Z·萨费
分类号 G10L15/08(2006.01)I;G10L15/18(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 永新专利商标代理有限公司 72002 代理人 宋献涛;王英
主权项 一种语音识别系统,其根据声音块(40)识别单词,所述语音识别系统包括单词识别器(49),所述单词识别器(49)包括:最佳路径计算器(47),其通过单词图(46)导出最佳路径,其中,给每个单词都分配了一个单词分值和一个音标,单词是基于所述最佳路径分配给所述声音块(40)的,音素识别器(41),其从所述声音块(40)中提取音素图(42),所述音素图用于给每个边界分配一个音素,其中,所述单词图上的单词的音标基于所述音素图,单词音素图生成器(43),其用于把所述音素图(42)转换成单词音素图(44),所述单词音素图用于给每个边界分配一个单词和相关的音标,单词图生成器(45),其将所述单词音素图(44)转换成所述单词图(46),所述单词图用于给每个边界分配一个单词;其中,所述单词图(46)中的每个单词的单词分值包括通过将音素语言模型(36)应用于所述单词音素图(44)的每个单词而获得的单词分值。
地址 奥地利维也纳