发明名称 使用多重语法网络之语音辨识系统
摘要 输入语音使用多数个语法网络被分割,其包含被设计代表杂讯或者外来语音的一组充填器模式之一组网络。辨识处理导致多数个候选者列表,各列表包含被产生的N组最佳候选者。该等列表接着分别地与有效名称字典对齐以产生两组有效名称列表。最后辨识回合将这两组名称列表组合成为一组动态语法并且这动态语法可被用以使用Viterbi辨识法找出最佳候选者名称。依据该辨识系统之电话呼叫路由应用选择对应于使用者所拼名称之最佳候选者名称,而不论使用者是否在拼音前发出该名称与否。
申请公布号 TW394926 申请公布日期 2000.06.21
申请号 TW087116807 申请日期 1998.10.09
申请人 松下电器产业股份有限公司 发明人 麦克.盖勒;珍–克劳蒂.荣瓜
分类号 G10L7/08;G10L9/06 主分类号 G10L7/08
代理机构 代理人 恽轶群 台北巿南京东路三段二四八号七楼;陈文郎 台北巿南京东路三段二四八号七楼
主权项 1.一种供字语辨识之语音资料处理方法,其包含: 依据第一语法模式使用一组辨识器处理该语音资 料以抽取第一组多数个辨识候选者; 依据不同于该第一语法模式之第二语法模式使用 一组辨识器处理该语音资料以抽取第二组多数个 辨识候选者; 将该第一组多数个辨识候选者与一预定字语字典 对齐以产生字语候选者之第一列表; 将该第二组多数个辨识候选者与该预定字语字典 对齐以产生字语候选者之第二列表; 从字语候选者之该第一和第二列表建立一组动态 语法模式;以及 依据该动态语法模式使用一组辨识器处理该语音 资料以抽取辨识字语。2.如申请专利范围第1项之 方法,其中该等第一和第二语法模式是包含多数个 互连文字模式之网络模式。3.如申请专利范围第2 项之方法,其中该文字模式是利用隐藏式马克夫模 式表示。4.如申请专利范围第1项之方法,其中该等 第一和第二语法模式是包含多数个互连文字模式 之网络模式并且该第二语法模式至少包含代表未 被该文字模式定义之语调的一组充填器模式。5. 如申请专利范围第1项之方法,其中该等第一和第 二语法模式是包含多数个互连文字模式之网络模 式并且该第二语法模式至少包含代表未被该文字 模式定义之语调的一组充填器模式以及代表该语 音资料中之暂停的一组静音模式。6.如申请专利 范围第1项之方法,其中该第二语法模式定义一种 文字配置语法。7.如申请专利范围第1项之方法,其 中该等第一和第二语法模式包含多数个不同的节 点并且其中该等第一和第二多数个辨识候选者被 依据该语音资料如何匹配该等节点而将该节点计 分之一种辨识程序抽取出;并且 其中该等第一和第二多数个辨识候选者是利用选 择被计分具有最匹配该语音资料之节点而被抽取 。8.如申请专利范围第1项之方法,其中该第二语法 模式包含至少一组用以代表杂讯之节点。9.如申 请专利范围第1项之方法,进一步地包含使用该辨 识字语引导一组电话呼叫。10.一种供所拼名称辨 识之语音资料的处理方法,其包含: 依据第一语法模式使用一组辨识器处理该语音资 料以抽取第一组多数个文字候选者; 依据第二语法模式使用一组辨识器处理该语音资 料以抽取第二组多数个文字候选者; 将该第一组多数个文字候选者与一预定名称字典 对齐以产生名称候选者之第一列表; 将该第二组多数个文字候选者与该预定名称字典 对齐以产生名称候选者之第二列表; 从名称候选者之该第一和第二列表建立一组动态 语法模式;以及 依据该动态语法模式使用一组辨识器处理该语音 资料以抽取辨识名称。11.如申请专利范围第10项 之方法,其中该等第一和第二语法模式是不同的。 12.如申请专利范围第10项之方法,其中该等第一和 第二语法模式是包含多数个互连文字模式之网络 模式。13.如申请专利范围第12项之方法,其中该文 字模式是利用隐藏式马克夫模式表示。14.如申请 专利范围第10项之方法,其中该等第一和第二语法 模式是包含多数个互连文字模式之网络模式并且 该第二语法模式至少包含代表末被该文字模式定 义之语调的一组充填器模式。15.如申请专利范围 第10项之方法,其中该等第一和第二语法模式是包 含多数个互连文字模式之网络模式并且该第二语 法模式至少包含代表未被该文字模式定义之语调 的一组充填器模式以及代表该语音资料中之暂停 的一组静音模式。16.如申请专利范围第10项之方 法,其中该第二语法模式定义一种文字配置语法。 17.如申请专利范围第10项之方法,其中该等第一和 第二语法模式包含多数个不同的节点并且其中该 等第一和第二多数个辨识候选者被依据该语音资 料如何匹配该等节点而将该节点计分之一种辨识 程序抽取出;并且 其中该等第一和第二多数个辨识候选者是利用选 择被计分具有最匹配该语音资料之节点而被抽取 。18.如申请专利范围第10项之方法,其中该第二语 法模式包含至少一组用以代表杂讯之节点。19.如 申请专利范围第10项之方法,进一步地包含使用该 辨识字语引导一组电话呼叫。20.一种供辨识之语 音资料处理方法,其包含: 依据一组第一语法网络使用一组辨识器处理该语 音资料以依据一组第一语音输入准则区分并且抽 取第一组多数个辨识候选者; 依据一组第二语法网络使用一组辨识器处理该语 音资料以依据一组第二语音输入准则区分并且抽 取第二组多数个辨识候选者; 依据该语音资料之至少一组预知限制转换该等第 一组和第二组多数个辨识候选者成为被转换候选 者; 依据该等被转换候选者形成辨识决定。21.一种供 辨识之语音资料处理方法,其包含: 使用导致该语音资料的不同区分之不同第一和第 二语法网络分别地处理该语音资料以便从不具有 实用性语音抽取具有实用性语音; 使用该第一语法网络产生第一组多数个辨识候选 者以及使用该第二语法网络产生第二组多数个辨 识候选者; 依据该具有实用性语音资料之至少一组预知限制 转换该等第一组和第二组多数个辨识候选者以产 生被转换辨识候选者;以及 依据该等被转换辨识候选者形成辨识决定。图式 简单说明: 第一图是使用本发明之呼叫路由元件的范例系统 之方块图; 第二图是本发明之呼叫路由元件的一种范例实施 例之方块图; 第三图展示假设所拼名称文字顺序以有效文字开 始而被组态的语法网络G1之状态图; 第四图展示假设所拼名称文字顺序以外来的杂讯 或者不被系统辨识之语调开始而被组态之语法网 络G2的状态图; 第五图是本发明之较佳辨识系统的详细方块图; 第六图是展示不同型式的辨识错误之图形; 第七图是展示PLP-RASTA滤波器系数之最佳化以减少 替代、删除以及插入错误之数目的图形; 第八图是展示改进的格子式N组最佳技术之图形; 第九图是进一步地描述在辨识的往回追踪步骤时 如何达成假设产生之图形。
地址 日本