发明名称 具有多个话音识别引擎的话音识别系统和方法
摘要 一种组合话音识别引擎并分析个体话音识别引擎所得结果之差别的方法和系统。组合说话者独立(SI)型隐型马尔可夫模型(HMM)引擎、说话者独立型动态时间偏差(DTW-SI)引擎和说话者依赖型动态时间偏差(DTW-SD)引擎。对这些引擎所得结果的组合和分析带来一种比仅用一个引擎所得结果时识别准确性高且拒收率低的系统。
申请公布号 CN1188831C 申请公布日期 2005.02.09
申请号 CN01814592.2 申请日期 2001.07.17
申请人 高通股份有限公司 发明人 H·加鲁达德里;D·P·欧瑟斯;毕宁;Y·Y·齐
分类号 G10L15/26 主分类号 G10L15/26
代理机构 上海专利商标事务所 代理人 张政权
主权项 1.一种话音识别系统,其特征在于包含配置成从发音的数字化话音取样提取话音参数的声处理器;连接该声处理器的多个话音识别引擎,各话音识别引擎配置成产生多个假设;以及决策逻辑,配置成将第一话音识别引擎的一个最可能假设与第一话音识别引擎的第二最可能假设进行比较,以形成第一差别Δ1;将第二话音识别引擎的一个最可能假设与第二话音识别引擎的第二最可能假设进行比较,以形成第二差别Δ2;将Δ1与Δ2相加形成Δ和;若第一话音识别引擎的最可能假设在可能性上与第二话音识别引擎的最可能假设相等,且Δ和大于一个第一预定阈值,则接受该第一话音识别引擎的最可能假设。
地址 美国加利福尼亚州