发明名称 模组化对话查询辨识方法和系统
摘要 本案系为一种语音辨识方法及系统,其中该方法之步骤包含(a)显示至少一个包含至少一建议选项之提示句与替换选项,以供一使用者参考;(b)接收该使用者之语音,并进行该语音之辨识;(c)根据该语音来搜寻一资料库,以产生至少一查询结果;以及(d)重覆步骤(a)至步骤(c),以缩小查询范围,直到该使用者获得其想要的查询结果。如果使用者输入的规格之间冲突,或资料库中没有使用者所要规格的查询结果时,系统也会建议使用者移除哪些规格方能查到东西。另外,本案还提出一个以模组的方式将资料库建立为查询对话系统的方法及系统,只要将资料库建立为系统指定的格式,并提供系统所指定的领域知识(domain knowledge),即可马上建立查询该资料库的查询对话系统。
申请公布号 TWI277948 申请公布日期 2007.04.01
申请号 TW094130227 申请日期 2005.09.02
申请人 台达电子工业股份有限公司 发明人 李允文;洪健洲
分类号 G10L15/08(2006.01);G06F17/30(2006.01) 主分类号 G10L15/08(2006.01)
代理机构 代理人 蔡清福 台北市中山区中山北路3段27号13楼
主权项 1.一种语音辨识方法,其步骤包含: (a)显示至少一个包含至少一建议选项之提示句与 替换选项,以供一使用者参考; (b)接收该使用者之语音,并进行该语音之辨识; (c)根据该语音来搜寻一资料库,以产生至少一查询 结果;以及 (d)重覆步骤(a)至步骤(c),以缩小查询范围,直到该 使用者获得其想要的查询结果。 2.如申请专利范围第1项所述之方法,其中该提示句 与该等替换选项系显示于一显示器上。 3.如申请专利范围第1项所述之方法,其中步骤(a)更 包含: 显示一第一选项状态、一第二选项状态、及一第 三选项状态,以供该使用者参考。 4.如申请专利范围第3项所述之方法,其中该第一选 项状态为"要"或"是"或"同意"等。 5.如申请专利范围第3项所述之方法,其中该第二选 项状态为"不要"或"不是"或"不同意"等。 6.如申请专利范围第3项所述之方法,其中该第三选 项状态为"无所谓"。 7.如申请专利范围第1项所述之方法,其中该资料库 系经由下列步骤来建立: 准备好一产品之领域资料库; 定义至少一个关于该产品之选项; 为每一选项标注所有可能的说法; 定义该等选项之间的分类及从属关系; 定义该等选项之间的冲突关系; 定义该产品之单位名称; 定义至少一个提示句; 定义缩小查询范围与放宽查询范围的准则;以及 建立一文法资料库、一领域知识资料库、及一冲 突资讯资料库。 8.如申请专利范围第7项所述之方法,其中该等选项 包含该等建议选项与该等替换选项。 9.如申请专利范围第8项所述之方法,其中该资料库 系为一特定领域资料库。 10.如申请专利范围第1项所述之方法,其中步骤(d) 更包含: 重覆步骤(a)至步骤(c),以放宽查询范围,直到该使 用者获得其想要的搜寻结果。 11.一种语音辨识系统,用以根据一语音输入而产生 一查询结果,其包含: 一语音辨识器,用以辨识该语音输入; 一语言理解器,连结于该语音辨识器,用以解析该 语音输入,以产生一语意; 一查询对话控制器,连结于该语言理解器,用以根 据该语意来进行对话控制及查询,以产生至少一提 示句与该查询结果; 一文法资料库,连结于该语音辨识器与该语言理解 器,用以储存复数个辨识字汇与复数个辨识文法, 以供该语音辨识器与该语言理解器进行该语音输 入之辨识与解析; 一领域资料库,连结于该查询对话控制器,用以储 存关于一产品之复数笔资料,而该查询结果系得自 该等资料; 一领域知识资料库,连结于该查询对话控制器,用 以储存关于该产品之领域知识;以及 一冲突资讯资料库,连结于该查询对话控制器,用 以储存关于该产品之至少一个选项间之冲突关系 。 12.如申请专利范围第11项所述之系统,更包含一连 结于该语音辨识器之语音输入装置,用以接收该语 音输入。 13.如申请专利范围第12项所述之系统,其中该语音 输入装置系为一麦克风。 14.如申请专利范围第11项所述之系统,更包含一连 结于该对话查询控制器之显示器,用以显示该提示 句与该查询结果。 15.如申请专利范围第11项所述之系统,更包含一连 结于该对话查询控制器之文字-语音转换器。 16.如申请专利范围第15项所述之系统,更包含一连 结于该文字-语音转换器之语音输出装置,用以产 生一语音输出。 17.如申请专利范围第15项所述之系统,其中该语音 辨识器、该语言理解器、该查询对话控制器、及 该文字-语音转换器系共同构成一查询对话系统。 18.如申请专利范围第11项所述之系统,其中该文法 资料库、该领域资料库、该领域知识资料库、及 该冲突资讯资料库系共同构成一特定领域资料库 。 19.一种语音辨识方法,其步骤包含: (a)显示至少一个包含至少一建议选项之提示句、 替换选项及选项状态,以供一使用者参考; (b)接收该使用者之语音,并进行该语音之辨识; (c)根据该语音来搜寻一资料库,以产生至少一查询 结果;以及 (d)重覆步骤(a)至步骤(c),以缩小查询范围,直到该 使用者获得其想要的查询结果。 20.如申请专利范围第19项所述之方法,其中该提示 句、该等替换选项及该等选项状态系显示于一显 示器上。 21.如申请专利范围第19项所述之方法,其中该等选 项状态至少包含一第一选项状态、一第二选项状 态、及一第三选项状态。 22.如申请专利范围第19项所述之方法,其中该第一 选项状态为"要"或"是"或"同意"等。 23.如申请专利范围第19项所述之方法,其中该第二 选项状态为"不要"或"不是"或"不同意"等。 24.如申请专利范围第19项所述之方法,其中该第三 选项状态为"无所谓"。 25.如申请专利范围第19项所述之方法,其中步骤(d) 更包含: 重覆步骤(a)至步骤(c),以放宽查询范围,直到该使 用者获得其想要的搜寻结果。 26.一种建立特定领域资料库之方法,其步骤包含: 准备好一产品之领域资料库; 定义至少一个关于该产品之选项; 为每一选项标注所有可能的说法; 定义该等选项之间的分类及从属关系; 定义该等选项之间的冲突关系; 定义该产品之单位名称; 定义至少一个提示句; 定义缩小查询范围与放宽查询范围的准则;以及 建立一文法资料库、一领域知识资料库、及一冲 突资讯资料库。 图式简单说明: 第一图:其系本案一较佳实施例之语音辨识系统之 架构图。 第二图:其系本案一较佳实施例之查询过程之流程 图。 第三图:其系本案一较佳实施例之建立特定领域资 料库之流程图。 第四图(a)~(d):其系本案一较佳实施例之实际查询 过程之示意图。
地址 桃园县龟山乡兴邦路31之1号