发明名称 软性判定语音辨识
摘要 本发明系有关用于语音辨识上之方法及设备,欲辨识之语音包含一或更多之辞。辨识系根据一第一及第二发话之分析。依据本发明,第一发话与一或更多之语音模型比较,以决定每一此比较之一相似性衡量。根据一或更多之相似性衡量决定最密切匹配该第一发话之语音模型。分析与最密切匹配之语音模型对应之相似性衡量,以决定该相似性衡量是否满足一第一辨识标准。第二发话与最密切匹配之模型相关之一或更多之语音模型(此可包含最密切匹配之模型)比较,以决定每一此比较之第二发话相似性衡量。分析一或更多之第二发话相似性衡量,以决定该一或更多之衡量是否满足一第二辨识标准。当满足第一及第二辨识标准时,辨识第二发话为与最密切匹配之语音模型相当之片语。本发明可应用于语音辨识之许多问题上,包括孤立之辞辨识及命令观察。提供单胞电话机方面之本发明之一例解实施例。亦讨论其他之实施例。
申请公布号 TW323364 申请公布日期 1997.12.21
申请号 TW083102745 申请日期 1994.03.30
申请人 电话电报股份有限公司 发明人 大卫.罗;毕斯纽.色路普.亚特;雷赛尔.海弥–哥亨
分类号 G10L7/08 主分类号 G10L7/08
代理机构 代理人 林志刚 台北巿南京东路二段一二五号七楼
主权项 1.一种辨识发话片语的方法,该片语包含一或更多之辞,方法包括以下步骤:执行第一语音辨识程序,以试图辨识片语之第一次发话,此第一程序运用第一语音辨识标准,但造成辨识第一发话之失败;建立容许接受该片语之另一次发话的时段;及如果在该时段中收到另一次发话,便执行第二语音辨识程序以试图辨识该另一次发话,该第二程序所运用之语音辨识标准较第一语音辨识标准更宽容。2.如申请专利范围第1项所述之方法,其中该第一程序包含以下步骤:根据第一发话与一或更多语音模型之比较,而为每一语音模型决定一第一相似性冲量;及判断是否有任何第一相似性衡量满足第一辨识标准。3.如申请专利范围第2项所述之方法,其中一个语音模型反映一或多个预定辞。4.如申请专利范围第3项所述之方法,其中该语音模型还反映一声音背景。5.如申请专利范围第2项所述之方法,其中该第一辨识标准包含判定第一相似性衡量是否超过第一临限値。6.如申请专利范围第1项所述之方法,其中该第二程序包含以下步骤:根据第二发话与一或更多语音模型之比较,而为每一语音模型决定一第二相似性衡量;判断第二相似性衡量何者满足所述较宽容之语音辨识标准;及辨识第二发话为与满足较宽容辨识标准之特定第二相似性衡量相对应的片语。7.如申请专利范围第6项所述之方法,其中该第一辨识标准包含判定第一相似性衡量是否超过第一临限値,且其中该较宽容辨识标准包含判定第二相似性衡量是否超过比第一临限値低的第二临限値。8.如申请专利范围第1项所述之方法,更包含将第一发话与一反映声音背景之模型予以比较的步骤。9.如申请专利范围第1项所述之方法,其中该片语包含对一使用装置之命令片语。10.如申请专利范围第1项所述之方法,另包括接收第一发话之步骤,且其中,该预定时段开始于第一发话之接收后之一预定时刻。11.如申请专利范围第1项所述之方法,另包括发出第二发话之提示的步骤,且其中,该预定时程开始于发出该提示后之一预定时刻。12.如申请专利范围第1项所述之方法,其中,该片语相当于一孤立之辞。13.如申请专利范围第1项所述之方法,其中,第一辨识标准系根据欲辨识之片语。14.如申请专利范围第1项所述之方法,其中,该较宽容之辨识标准系根据欲辨识之片语。15.如申请专利范围第1项所述之方法,其中,第一辨识标准系根据使用装置之状态。16.如申请专利范围第1项所述之方法,其中,该较宽容之辨识标准系根据使用装置之状态。17.如申请专利范围第1项所述之方法,其中,该等步骤实施于雷传通讯网路上,以方便网路服务之操作。18.如申请专利范围第1项所述之方法,其中,该等步骤实施于电脑上,以方便电脑之操作。19.一种辨识发话片语的设备,该片语包含一或更多之辞,设备包含:执行第一语音辨识程序,以试图辨识片语之第一次发话的装置,该第一程序运用第一语音辨识标准;建立容许接受该片语另一次发话的时段之装置;及如果在该时段中收到另一次发话,便执行第二语音辨识程序以试图辨识该另一次发话的装置,该第二程序所运用之语音辨识标准较第一语音辨识标准更宽容。20.如申请专利范围第19项所述之设备,其中该第一程序执行装置包含:根据第一发话与一或更多语音模型之比较,而为每一语音模型决定一第一相似性衡量的装置;及判断是否有任何第一相似性衡量满足第一辨识标准。21.如申请专利范围第20项所述之设备,其中一个语音模型反映一或多个预定辞。22.如申请专利范围第21项所述之设备,其中该语音模型还反映一声音背景。23.如申请专利范围第20项所述之设备,其中该第一辨识标准包含判定第一相似性衡量是否超过第一临限値。24.如申请专利范围第19项所述之设备,其中该第二程序执行装置包含:根据第二发话与一或更多语音模型之比较,而为每一语音模型决定一第二相似性衡量的装置;判断第二相似性衡量何者满足所述较宽容之语音辨识标准的装置;及辨识第二发话为与满足较宽容辨识标准之特定第二相似性衡量相对应的片语之装置。25.如申请专利范围第24项所述之设备,其中该第一辨识标准包含判定第一相似性衡量是否超过第一临限値,且其中该较宽容辨识标准包含判定第二相似性衡量是否超过比第一临限値低的第二临限値。26.如申请专利范围第19项所述之设备,更包含将第一发话与一反映声音背景之模型予以比较的装置。27.如申请专利范围第19项所述之设备,其中该片语包含对一使用装置之命令片语。28.如申请专利范围第19项所述之设备,另包括接收第一发话之装置,且其中,该预定时段开始于第一发话之接收后之一预定时刻。29.如申请专利范围第19项所述之设备,另包括发出第二发话之提示的装置,且其中,该预定时程开始于发出该提示后之一预定时刻。30.如申请专利范围第19项所述之设备,其中,该片语相当于一孤立之辞。31.如申请专利范围第19项所述之设备,其中,第一辨识标准系根据欲辨识之片语。32.如申请专利范围第19项所述之设备,其中,该较宽容之辨识标准系根据欲辨识之片语。33.如申请专利范围第19项所述之设备,其中,第一辨识标准系根据使用装置之状态。34.如申请专利范围第19项所述之设备,其中,该较宽容之辨识标准系根据使用装置之状态。35.一种电话机,包含:(1)一微音器;(2)一语音辨识器,与微音器连接,以供辨识一发话片语,该片语包含一或更多之辞,该语音辨识器包含执行第一语音辨识程序,以试图辨识片语之第一次发话,此第一程序运用第一语音辨识标准;建立容许接受该片语另一次发话的时段之装置;及如果在该时段中收到另一次发话,便执行第二语音辨识程序以试图辨识该另一次发话的装置,该第二程序所运用之语音辨识标准较第一语音辨识标准更宽容;以及(3)一电话电路,用以反应该经辨识之第二发话而提供电话机操作。36.如申请专利范围第35项所述之电话机,另包含:一无线电收发机;及声频处理装置,用以介面连接微音器及电话电路至收发机,该声频处理装置反应由电话电路所提供之控制信号。37.如申请专利范围第35项所述之电话机,其中,该微音器为免手持之微音器。38.如申请专利范围第35项所述之电话机,其中,该微音器为手持微音器。39.如申请专利范围第35项所述之电话机,另包含一无线电收发机,连接至该电话机,以提供无线电话通信。图示简单说明:第一图显示本发明之一例解单胞电话机实施例。第二图显示第一图之语音辨识系统之数位信号处理器之处理之方块流程图。第三图显示第二图之决定器方块之处理之方块流程图。第四图显示由第一-三图之例解实施例所执行之辨识处理之一例。第五图显示辨识器参数値及辨识器性能间之关系曲线。
地址 美国