发明名称 在话音识别的说话者独立型和依赖型模式中组合DTW和HMM
摘要 一种组合语音识别引擎(104,108,112,114)并用映射函数求解单个语音识别引擎(104,106,112,114)间差异的方法和系统。将说话者独立型语音识别引擎104和说话者依赖型语音识别引擎106组合在一起。将隐马尔可夫模型(HMM)引擎(108,114)和动态时间偏差(DTW)引擎(104,106,112)组合在一起。
申请公布号 CN1238836C 申请公布日期 2006.01.25
申请号 CN01815363.1 申请日期 2001.09.05
申请人 高通股份有限公司 发明人 Y·Y·齐;毕宁;H·加鲁达德里
分类号 G10L15/26(2006.01) 主分类号 G10L15/26(2006.01)
代理机构 上海专利商标事务所有限公司 代理人 李家麟
主权项 1.一种语音识别系统,包括:多个语音识别(VR)引擎,每个语音识别引擎配置成能产生候选词;及映射模块,配置成能从多个VR引擎取得候选词作为输入,并依据映射函数选择候选词,其中,所述映射函数是:<math> <mrow> <msub> <mi>M</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>F</mi> <mo>,</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>C</mi> <mn>0</mn> </msub> <mo>+</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <msubsup> <mi>F</mi> <mn>1</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>2</mn> </msub> <msubsup> <mi>F</mi> <mn>2</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>3</mn> </msub> <msub> <mi>F</mi> <mi>g</mi> </msub> <mo>+</mo> <msub> <mi>c</mi> <mn>4</mn> </msub> <msubsup> <mi>S</mi> <mn>1</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>5</mn> </msub> <msubsup> <mi>S</mi> <mn>2</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mi>n</mi> </msub> <msub> <mi>S</mi> <mi>g</mi> </msub> </mrow> </math> 其中F是第一个语音识别引擎,S是第二个语音识别引擎,F1Wi是发音Tu和候选词Wi间的距离,F2Wi是除Wi之外的第二最佳候选词的距离,Fg表示Tu和无用信息模板间的距离,S1Wi是发音Tu和Wi间的距离,S2Wi是除Wi之外的第二最佳候选词的距离,Sg表示Tu和无用信息模板间的距离,而ci(i=0,1,...,n)是一系数,并且上限n等于VR引擎个数加上每个VR引擎的候选词和的总和。
地址 美国加利福尼亚州
您可能感兴趣的专利