主权项 |
1.一种语音识别系统,包括:多个语音识别(VR)引擎,每个语音识别引擎配置成能产生候选词;及映射模块,配置成能从多个VR引擎取得候选词作为输入,并依据映射函数选择候选词,其中,所述映射函数是:<math> <mrow> <msub> <mi>M</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>F</mi> <mo>,</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>C</mi> <mn>0</mn> </msub> <mo>+</mo> <msub> <mi>c</mi> <mn>1</mn> </msub> <msubsup> <mi>F</mi> <mn>1</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>2</mn> </msub> <msubsup> <mi>F</mi> <mn>2</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>3</mn> </msub> <msub> <mi>F</mi> <mi>g</mi> </msub> <mo>+</mo> <msub> <mi>c</mi> <mn>4</mn> </msub> <msubsup> <mi>S</mi> <mn>1</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mn>5</mn> </msub> <msubsup> <mi>S</mi> <mn>2</mn> <msub> <mi>W</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <msub> <mi>c</mi> <mi>n</mi> </msub> <msub> <mi>S</mi> <mi>g</mi> </msub> </mrow> </math> 其中F是第一个语音识别引擎,S是第二个语音识别引擎,F1Wi是发音Tu和候选词Wi间的距离,F2Wi是除Wi之外的第二最佳候选词的距离,Fg表示Tu和无用信息模板间的距离,S1Wi是发音Tu和Wi间的距离,S2Wi是除Wi之外的第二最佳候选词的距离,Sg表示Tu和无用信息模板间的距离,而ci(i=0,1,...,n)是一系数,并且上限n等于VR引擎个数加上每个VR引擎的候选词和的总和。 |