发明名称 | 对噪声相对健全的语音识别系统和方法 | ||
摘要 | 语音识别采用一个宽语言符号编制器(66),增益和噪声适配器(70)和一种噪声适配的动态时间弯曲(60)。宽语言符号编制器产生用输入测试语调前、后的至少一个空白帧扩展的一个填充的测试语言符号。增益和噪声适配器用噪声和增益量适配每一个填充的参考模板,产生具有噪声帧的适配的参考模板,随便空白帧原先在哪里,在讲话时让噪声适配语音。在噪声适配的模板上执行动态时间弯曲(DTW)。 | ||
申请公布号 | CN1335978A | 申请公布日期 | 2002.02.13 |
申请号 | CN00802564.9 | 申请日期 | 2000.01.03 |
申请人 | D.S.P.C.科技有限公司 | 发明人 | 阿多姆·艾瑞尔 |
分类号 | G10L15/20;G10L15/12 | 主分类号 | G10L15/20 |
代理机构 | 北京康信知识产权代理有限责任公司 | 代理人 | 吴磊 |
主权项 | 1.一种语音识别方法,其包括以下步骤:产生一个展宽的测试语言符号,它代表一个输入测试语调和上述输入测试语调前、后的至少一帧;估算上述展宽的测试语言符号的噪声量;至少在每个参考模板的开头或是结尾用至少一个空白帧填充多个上述参考模板;用每个上述填充的参考模板适配上述噪声量,从而产生噪声适配的参考模板,随便空白帧原先在哪里,在讲话时让噪声适应语音;以及执行噪声适配的DTW运算,将上述展宽的语言符号和上述噪声适配的参考模板之一相比较,在和一个上述噪声帧相比较时不采用时间限制。 | ||
地址 | 以色列吉威特萨米尔市 |