主权项 |
一种语音搜索列表的实现方法,其特征在于,包括如下步骤:(1)列表预处理:一个列表,提取每个列表项C的所有属性的关键字,切词且去除重复,得到词汇样本V(v<sub>1</sub>,v<sub>2</sub>,…v<sub>n</sub>),有n个独立的词;(2)语音识别将词汇样本V传送给语音识别器,并加载UNIGRAM语言模型,进行语音识别,得到N‑BEST结果R,其中每个结果<img file="FDA0001143809400000011.GIF" wi="525" he="94" />t为识别出的词,w为该词的权重;(3)计算似然估计值对每个列表项C,计算其归一化的似然估计值lik(C); lik(c)=П<sub>r∈R</sub> f(c|r) f(c|r)=∏<sub>t∈R</sub> g(t|c)<maths num="0001"><math><![CDATA[<mrow><mi>g</mi><mrow><mo>(</mo><mi>t</mi><mo>|</mo><mi>c</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = '}'><mtable><mtr><mtd><mrow><mi>a</mi><mo>·</mo><mi>w</mi><mo>,</mo><mi>t</mi><mo>∈</mo><mi>c</mi></mrow></mtd></mtr><mtr><mtd><mrow><mi>b</mi><mo>·</mo><mi>w</mi><mo>,</mo><mi>t</mi><mo>∉</mo><mi>c</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001143809400000012.GIF" wi="507" he="107" /></maths>其中,a、b为预设的常数,c为一个列表项,r为一个语音识别结果,t为一个识别的词,w为一个识别的词t的权重;(4)列表搜索;根据列表项的似然估计值重新排序,选出似然估计值最大的列表项。 |