发明名称 |
具有巨大词汇量的语音识别系统 |
摘要 |
本发明涉及语音识别,例如用于识别连续语音中的单词的系统。所公开的语音识别系统能够识别大量的单词,在原理上甚至能够识别无限量的单词。所述语音识别系统包括单词识别器,其通过单词图导出最佳路径,其中,基于最佳路径把单词分配给语音。单词分值是通过将音素语言模型应用于单词图的每个单词而获得的。此外,本发明涉及根据声音块识别单词的装置和方法,还涉及用于实现所述方法的计算机可读代码。 |
申请公布号 |
CN101326572B |
申请公布日期 |
2011.07.06 |
申请号 |
CN200680046025.9 |
申请日期 |
2006.12.06 |
申请人 |
纽昂斯奥地利通讯有限公司 |
发明人 |
Z·萨费 |
分类号 |
G10L15/08(2006.01)I;G10L15/18(2006.01)I |
主分类号 |
G10L15/08(2006.01)I |
代理机构 |
永新专利商标代理有限公司 72002 |
代理人 |
宋献涛;王英 |
主权项 |
一种语音识别系统,其根据声音块(40)识别单词,所述语音识别系统包括单词识别器(49),所述单词识别器(49)包括:最佳路径计算器(47),其通过单词图(46)导出最佳路径,其中,给每个单词都分配了一个单词分值和一个音标,单词是基于所述最佳路径分配给所述声音块(40)的,音素识别器(41),其从所述声音块(40)中提取音素图(42),所述音素图用于给每个边界分配一个音素,其中,所述单词图上的单词的音标基于所述音素图,单词音素图生成器(43),其用于把所述音素图(42)转换成单词音素图(44),所述单词音素图用于给每个边界分配一个单词和相关的音标,单词图生成器(45),其将所述单词音素图(44)转换成所述单词图(46),所述单词图用于给每个边界分配一个单词;其中,所述单词图(46)中的每个单词的单词分值包括通过将音素语言模型(36)应用于所述单词音素图(44)的每个单词而获得的单词分值。 |
地址 |
奥地利维也纳 |