使用多重语法网络之语音辨识系统,申请号TW087116807-传众专利搜索

发明名称	使用多重语法网络之语音辨识系统
摘要	输入语音使用多数个语法网络被分割，其包含被设计代表杂讯或者外来语音的一组充填器模式之一组网络。辨识处理导致多数个候选者列表，各列表包含被产生的N组最佳候选者。该等列表接着分别地与有效名称字典对齐以产生两组有效名称列表。最后辨识回合将这两组名称列表组合成为一组动态语法并且这动态语法可被用以使用Viterbi辨识法找出最佳候选者名称。依据该辨识系统之电话呼叫路由应用选择对应于使用者所拼名称之最佳候选者名称，而不论使用者是否在拼音前发出该名称与否。
申请公布号	TW394926	申请公布日期	2000.06.21
申请号	TW087116807	申请日期	1998.10.09
申请人	松下电器产业股份有限公司	发明人	麦克.盖勒;珍–克劳蒂.荣瓜
分类号	G10L7/08;G10L9/06	主分类号	G10L7/08
代理机构		代理人	恽轶群台北巿南京东路三段二四八号七楼;陈文郎台北巿南京东路三段二四八号七楼
主权项	1.一种供字语辨识之语音资料处理方法,其包含: 依据第一语法模式使用一组辨识器处理该语音资料以抽取第一组多数个辨识候选者; 依据不同于该第一语法模式之第二语法模式使用一组辨识器处理该语音资料以抽取第二组多数个辨识候选者; 将该第一组多数个辨识候选者与一预定字语字典对齐以产生字语候选者之第一列表; 将该第二组多数个辨识候选者与该预定字语字典对齐以产生字语候选者之第二列表; 从字语候选者之该第一和第二列表建立一组动态语法模式;以及依据该动态语法模式使用一组辨识器处理该语音资料以抽取辨识字语。2.如申请专利范围第1项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式。3.如申请专利范围第2 项之方法,其中该文字模式是利用隐藏式马克夫模式表示。4.如申请专利范围第1项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式并且该第二语法模式至少包含代表未被该文字模式定义之语调的一组充填器模式。5. 如申请专利范围第1项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式并且该第二语法模式至少包含代表未被该文字模式定义之语调的一组充填器模式以及代表该语音资料中之暂停的一组静音模式。6.如申请专利范围第1项之方法,其中该第二语法模式定义一种文字配置语法。7.如申请专利范围第1项之方法,其中该等第一和第二语法模式包含多数个不同的节点并且其中该等第一和第二多数个辨识候选者被依据该语音资料如何匹配该等节点而将该节点计分之一种辨识程序抽取出;并且其中该等第一和第二多数个辨识候选者是利用选择被计分具有最匹配该语音资料之节点而被抽取。8.如申请专利范围第1项之方法,其中该第二语法模式包含至少一组用以代表杂讯之节点。9.如申请专利范围第1项之方法,进一步地包含使用该辨识字语引导一组电话呼叫。10.一种供所拼名称辨识之语音资料的处理方法,其包含: 依据第一语法模式使用一组辨识器处理该语音资料以抽取第一组多数个文字候选者; 依据第二语法模式使用一组辨识器处理该语音资料以抽取第二组多数个文字候选者; 将该第一组多数个文字候选者与一预定名称字典对齐以产生名称候选者之第一列表; 将该第二组多数个文字候选者与该预定名称字典对齐以产生名称候选者之第二列表; 从名称候选者之该第一和第二列表建立一组动态语法模式;以及依据该动态语法模式使用一组辨识器处理该语音资料以抽取辨识名称。11.如申请专利范围第10项之方法,其中该等第一和第二语法模式是不同的。 12.如申请专利范围第10项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式。13.如申请专利范围第12项之方法,其中该文字模式是利用隐藏式马克夫模式表示。14.如申请专利范围第10项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式并且该第二语法模式至少包含代表末被该文字模式定义之语调的一组充填器模式。15.如申请专利范围第10项之方法,其中该等第一和第二语法模式是包含多数个互连文字模式之网络模式并且该第二语法模式至少包含代表未被该文字模式定义之语调的一组充填器模式以及代表该语音资料中之暂停的一组静音模式。16.如申请专利范围第10项之方法,其中该第二语法模式定义一种文字配置语法。 17.如申请专利范围第10项之方法,其中该等第一和第二语法模式包含多数个不同的节点并且其中该等第一和第二多数个辨识候选者被依据该语音资料如何匹配该等节点而将该节点计分之一种辨识程序抽取出;并且其中该等第一和第二多数个辨识候选者是利用选择被计分具有最匹配该语音资料之节点而被抽取。18.如申请专利范围第10项之方法,其中该第二语法模式包含至少一组用以代表杂讯之节点。19.如申请专利范围第10项之方法,进一步地包含使用该辨识字语引导一组电话呼叫。20.一种供辨识之语音资料处理方法,其包含: 依据一组第一语法网络使用一组辨识器处理该语音资料以依据一组第一语音输入准则区分并且抽取第一组多数个辨识候选者; 依据一组第二语法网络使用一组辨识器处理该语音资料以依据一组第二语音输入准则区分并且抽取第二组多数个辨识候选者; 依据该语音资料之至少一组预知限制转换该等第一组和第二组多数个辨识候选者成为被转换候选者; 依据该等被转换候选者形成辨识决定。21.一种供辨识之语音资料处理方法,其包含: 使用导致该语音资料的不同区分之不同第一和第二语法网络分别地处理该语音资料以便从不具有实用性语音抽取具有实用性语音; 使用该第一语法网络产生第一组多数个辨识候选者以及使用该第二语法网络产生第二组多数个辨识候选者; 依据该具有实用性语音资料之至少一组预知限制转换该等第一组和第二组多数个辨识候选者以产生被转换辨识候选者;以及依据该等被转换辨识候选者形成辨识决定。图式简单说明: 第一图是使用本发明之呼叫路由元件的范例系统之方块图; 第二图是本发明之呼叫路由元件的一种范例实施例之方块图; 第三图展示假设所拼名称文字顺序以有效文字开始而被组态的语法网络G1之状态图; 第四图展示假设所拼名称文字顺序以外来的杂讯或者不被系统辨识之语调开始而被组态之语法网络G2的状态图; 第五图是本发明之较佳辨识系统的详细方块图; 第六图是展示不同型式的辨识错误之图形; 第七图是展示PLP-RASTA滤波器系数之最佳化以减少替代、删除以及插入错误之数目的图形; 第八图是展示改进的格子式N组最佳技术之图形; 第九图是进一步地描述在辨识的往回追踪步骤时如何达成假设产生之图形。
地址	日本