发明名称 语音辨识方法及系统
摘要 本案系为一种语音辨识方法及系统,系采用一显示装置来显示辨识的结果,并配合一锁定装置来进行确认动作,以取代知使用语音对话来进行确认的方法。在本案之另一实施例中,系使用小部分的萤幕来作为语言理解的沟通介面,并配合一小型键盘来进行确认/更正动作,以取代知使用语音对话来进行确认的方法。
申请公布号 TWI269268 申请公布日期 2006.12.21
申请号 TW094102062 申请日期 2005.01.24
申请人 台达电子工业股份有限公司 发明人 蔡锦和;王瑞璋
分类号 G10L15/28(2006.01) 主分类号 G10L15/28(2006.01)
代理机构 代理人 蔡清福 台北市中山区中山北路3段27号13楼
主权项 1.一种语音辨识之方法,其步骤包含:(a)接收一使用者之语音,并进行该语音之辨识,以产生复数个辨识结果;(b)显示该等辨识结果,以供该使用者锁定该等辨识结果中之正确値;(c)判断该正确値是否充足;(d)当该正确値不充足时,将该正确値储存为已知値,缩小辨识范围并重覆步骤(a)至步骤(c);以及(e)当该正确値充足时,根据该正确値来搜寻一资料。2.如申请专利范围第1项所述之方法,其中该等辨识结果系显示于一显示装置上。3.如申请专利范围第2项所述之方法,其中该显示装置系为一触摸式萤幕(touch screen)。4.如申请专利范围第1项所述之方法,其中步骤(b)中,该使用者系经由一锁定装置来锁定该等辨识结果中之正确値。5.如申请专利范围第4项所述之方法,其中该锁定装置系为一按键、该触摸式萤幕(touch screen)、或一遥控器。6.如申请专利范围第1项所述之方法,其中该已知値系储存于一储存装置。7.如申请专利范围第6项所述之方法,其中该第一储存装置系为一暂存器。8.如申请专利范围第1项所述之方法,其中步骤(e)中,当该正确値充足时,系根据该正确値来搜寻一资料库。9.如申请专利范围第8项所述之方法,其中该资料库系为一记忆体(memory)、一快闪磁碟(flash disk)、一硬碟(hard disk)、或一远端伺服器(server)。10.如申请专利范围第1项所述之方法,更包含在部分正确値已知的状态下,重新辨识之前该使用者所输入之该语音之步骤。11.一种语音辨识之方法,其步骤包含:(a)于一显示装置上显示复数个栏位,其中每一栏位系对应于一类别;(b)该使用者根据该等类别而输入一语音;(c)辨识该语音,以产生复数个辨识结果;(d)显示该等辨识结果于其对应之栏位,以供该使用者经由一锁定装置来锁定该等辨识结果中之正确値;(e)判断该正确値是否充足;(f)当该正确値不充足时,将该正确値储存为已知値,缩小辨识范围并重覆步骤(b)至步骤(e);以及(g)当该正确値充足时,根据该正确値来搜寻一资料。12.如申请专利范围第11项所述之方法,更包含在部分正确値已知的状态下,重新辨识之前该使用者所输入之该语音之步骤。13.如申请专利范围第11项所述之方法,更包含在该等栏位尚未全部填满前,径行搜寻该资料之步骤。14.一种语音辨识系统,其包含:一语音输入装置,用以接收一使用者之一语音;一语音辨识装置,连结于该语音输入装置,用以辨识该语音,以产生复数个辨识结果;一显示装置,连结于该语音辨识装置,用以显示该等辨识结果;一锁定装置,连结于该显示装置,用以供该使用者锁定该等辨识结果中之正确値;一储存装置,用以将该正确値储存为已知値;以及一资料库,用以存放一资料,以供系统根据该正确値来搜寻该资料。15.如申请专利范围第14项所述之系统,其中该显示装置系为一触摸式萤幕。16.如申请专利范围第14项所述之系统,其中该锁定装置系为一按键、该触摸式萤幕、或一遥控器。17.如申请专利范围第14项所述之系统,其中该储存装置系为一暂存器。18.如申请专利范围第14项所述之系统,系于该正确値不充足时,经由该储存装置将该正确値储存为已知値。19.如申请专利范围第14项所述之系统,其中该资料库系为一记忆体、一快闪磁碟、一硬碟、或一远端伺服器。20.如申请专利范围第14项所述之系统,系于该正确値充足时,根据该正确値来搜寻该资料库,以找出该资料。21.一种语音辨识之方法,其步骤包含:(a)接收一使用者之语音,并进行该语音之辨识,以产生复数个辨识结果;(b)显示该等辨识结果其中之一,以供该使用者进行确认/更正;(c)重覆步骤(b),直到该使用者完成所有辨识结果之确认/更正;以及(d)根据该确认/更正后之辨识结果来搜寻一资料。22.如申请专利范围第21项所述之方法,其中该等辨识结果系逐一显示于一显示装置之一特定区域。23.如申请专利范围第22项所述之方法,其中该等辨识结果系依照「类别-内容値」之格式来显示。24.如申请专利范围第23项所述之方法,其中步骤(b)中,该使用者系经由一控制装置来逐一确认/更正该「类别-内容値」。25.如申请专利范围第24项所述之方法,其中该控制装置系为一小型键盘、一遥控器、或一个人数位助理(personal digital assistant)。26.如申请专利范围第25项所述之方法,其中该小型键盘包含一录音/播音键、一接受键、一拒绝键、一类别更正键、及一内容値更正键。27.如申请专利范围第24项所述之方法,更包含于任一「类别-内容値」之确认/更正完成后,即根据该确认/更正后之「类别-内容値」来搜寻该资料之步骤。28.如申请专利范围第22项所述之方法,更包含判断其他尚未完成确认/更正之「类别-内容値」是否还要继续进行确认/更正之步骤。29.一种语音辨识系统,其包含:一输入装置,用以接收一使用者之一语音;一语音辨识理解器,连结于该输入装置,用以因应该语音而产生复数个辨识结果;一语义确认/更正模组,连结于该语音辨识理解器,用以确认/更正该等辨识结果;一显示装置,连结于该语义确认/更正模组,用以逐一显示该等辨识结果于其上之一特定区域;一控制装置,连结于该语义确认/更正模组,用以供该使用者进行该等辨识结果之确认/更正;以及一搜寻模组,连结于该语义确认/更正模组,用以根据该确认/更正后之辨识结果来搜寻一资料。30.如申请专利范围第29项所述之系统,更包含一储存/接收装置,用以存放该资料。31.如申请专利范围第30项所述之系统,其中该资料系为数位资料或影音节目。32.如申请专利范围第29项所述之系统,其中该输入装置系为一麦克风。33.如申请专利范围第29项所述之系统,其中该语音辨识理解器包含一语音辨识器及一语言理解器。34.如申请专利范围第33项所述之系统,其中该语音辨识器系根据一语汇来进行语音辨识。35.如申请专利范围第33项所述之系统,其中该语言理解器系根据一文法来进行语言理解。36.如申请专利范围第29项所述之系统,其中该等辨识结果系为「类别-内容値」对。37.如申请专利范围第29项所述之系统,其中该语言确认/更正模组系为一互动式语义确认/更正软体元件。38.如申请专利范围第29项所述之系统,其中该控制装置系为一小型键盘、一遥控器、或一个人数位助理。39.如申请专利范围第38项所述之方法,其中该小型键盘包含一录音/播音键、一接受键、一拒绝键、一类别更正键、及一内容値更正键。40.如申请专利范围第29项所述之系统,其中该搜寻模组系为一搜寻软体元件。41.一种语音辨识之方法,其步骤包含:(a)接收一使用者之语音,并进行该语音之辨识,以产生复数个辨识结果;(b)显示该等辨识结果,一以供该使用者进行确认/更正;(c)根据该确认/更正后之辨识结果来搜寻一资料。42.如申请专利范围第41项所述之方法,其中该等辨识结果系同时显示。43.如申请专利范围第41项所述之方法,其中该等辨识结果系逐一显示。44.如申请专利范围第41项所述之方法,其中步骤(b)中,系经由该使用者重新输入之语音来进行更正。45.如申请专利范围第41项所述之方法,其中步骤(b)中,系经由一控制装置来进行更正。图式简单说明:第一图:其系习知语音辨识方法之流程图。第二图:其系本案一较佳实施例之语音辨识系统之架构图。第三图:其系本案一较佳实施例之语音辨识方法之流程图。第四图:其系本案一较佳实施例之语音辨识系统应用于一手持随身装置之示意图。第五图:其系本案另一较佳实施例之语音辨识系统之架构图。第六图:其系本案另一较佳实施例之小型键盘之按键功能示意图。第七图:其系本案另一较佳实施例之语音辨识系统应用于一MP3随身听之示意图。第八图:其系本案另一较佳实施例之语音辨识系统应用于一电视机之示意图。
地址 桃园县龟山乡兴邦路31之1号