发明名称 隐含式-马而科夫-发音模型在语音识别系统中的匹配方法
摘要 用本发明一个普通的提供给一个语言识别系统使用的隐含式-马而科夫发音模型的编码簿(CB)被适应于专门的应用情况。这些应用情况是通过被使用者改变的一个应用词典(LEX)定义的。适应(ADAP)是在运行中完成的,并且是通过隐含式-马而科夫-模型的概率密度分布的被存储的中心矢量的一个位移发生的,是在一个被识别的发音表达的特征矢量方向上并且是参照应用的隐含式-马而科夫-模型。与常用的方法对比本发明具有的优点是,它是在线运行的,并且它在一个小的计算费用情况下保证一个很高的识别率。通过多舌音音素的专用隐含式-马而科夫-模型的应用,在其中超出各种语言的发音相似性被充分利用,可以完成对外语的一个自动的适应。在所使用的声学发音建模方法中在综合不同的隐含式-马而科夫-发音模型在不同语言中的概率密度时不仅考虑了语言专用的而且也考虑了与语言无关的特性。
申请公布号 CN1237259A 申请公布日期 1999.12.01
申请号 CN97199583.4 申请日期 1997.09.10
申请人 西门子公司 发明人 U·巴布;H·赫格;J·科勒
分类号 G10L5/06 主分类号 G10L5/06
代理机构 中国专利代理(香港)有限公司 代理人 马铁良;王忠忠
主权项 1.一个语言识别系统的编码簿中的一个隐含式-马而科夫-发音模型与被使用的音素词典中的一个字库改变时的实时-匹配方法,a)在其中被识别的隐含式-马而科夫-发音模型至少有它的概率分布的一个第一平均值矢量被保存在编码簿(CB)中可提供使用,b)在其中在一般情况下语言识别(ERKE)是通过从一个语言信号(SPRA)中提取特征矢量,并将特征矢量分配给编码簿(CB)中的隐含式-马而科夫-发音模型的概率分布来进行的,c)和在其中对于字库改变的至少一个被识别的发音表达(Lautuβerung)(WO)立即在它识别以后,至少一个从属的隐含式-马而科夫-发音模型的第一重心矢量的位置,与被附加的特征矢量的位置,通过一个被确定的匹配系数在比例上被匹配(ADAP,CB,100),并且被匹配的平均值矢量在编码簿(CB)中作为第一平均值矢量被存放。
地址 联邦德国慕尼黑