发明名称 可选择句型之语音输入方法及装置
摘要 本发明提供一种语音输入装置,该语音输入装置系包含:一句型选择单元,用以提供复数种句型;一输出介面,用以输出并切换该复数种句型以供一使用者选择;一语音辨识单元,用以辨识该使用者所输入之一语音而得到一辨识结果;一内容资料库,用以储存一资料;以及一资料库搜寻单元,其系依据该辨识结果至该内容资料库搜寻对应之该资料。本发明更提供一种语音输入方法,该语音输入方法包含:(a)提供复数种句型;(b)显示并切换该复数种句型;(c)选择该复数种句型其中之一;(d)启动一模型,以对应该所选择句型;(e)输入一语音;(f)参考该模型对该语音进行辨识,并产生一辨识结果;(g)将该辨识结果输入至一资料库搜寻单元;以及(h)由该资料库搜寻单元至一内容资料库,搜寻对应该辨识结果之一内容。
申请公布号 TWI293753 申请公布日期 2008.02.21
申请号 TW093141877 申请日期 2004.12.31
申请人 台达电子工业股份有限公司 发明人 黄良声;廖文伟;沈家麟
分类号 G10L15/02(2006.01) 主分类号 G10L15/02(2006.01)
代理机构 代理人 蔡清福 台北市中山区中山北路3段27号13楼
主权项 1.一种可选择句型之语音输入装置,其包含: 一句型选择单元,用以提供复数种句型; 一输出介面,用以输出并切换该复数种句型以供一 使用者选择; 一语音辨识单元,用以辨识该使用者所输入之一语 音而得到一辨识结果; 一内容资料库,用以储存一资料;以及 一资料库搜寻单元,其系依据该辨识结果至该内容 资料库搜寻对应之该资料。 2.如申请专利范围第1项所述之装置,其中该输出介 面系为一显示器。 3.如申请专利范围第1项所述之装置,其中该输出介 面系为一扬声器。 4.如申请专利范围第1项所述之装置,其中该语音辨 识单元更包含: 一输入装置,用以输入该语音; 一特征参数撷取装置,用以撷取所输入之该语音之 特征参数; 一辨识字汇和语言模型目录,其系包含复数组辨识 字汇和语言模型,用以供辨识参考用; 一声学模型,用以供辨识参考用;以及 一语音辨识引擎,其系根据该语音之特征参数、该 复数组辨识字汇和语言模型及该声学模型,以辨识 该语音。 5.如申请专利范围第1项所述之装置,其中当该使用 者选择该复数种句型其中之一后,该句型选择单元 便启动对应该所选择句型之该辨识字汇和语言模 型,以供该语音辨识引擎参考。 6.一种可选择句型之语音输入方法,其步骤系包含: (a)提供复数种句型; (b)显示并切换该复数种句型; (c)选择该复数种句型其中之一; (d)启动一模型,以对应该所选择句型; (e)输入一语音; (f)参考该模型对该语音进行辨识,并产生一辨识结 果; (g)将该辨识结果输入至一资料库搜寻单元;以及 (h)由该资料库搜寻单元至一内容资料库,搜寻对应 该辨识结果之一内容。 7.如申请专利范围第6项所述之方法,其中步骤(f)更 包含下列步骤: (f1)撷取该语音之一特征参数;以及 (f2)依据该特征参数,参考该模型对该语音进行辨 识。 8.如申请专利范围第7项所述之方法,其中步骤(f1) 更包含下列步骤: (f11)对该语音进行预处理;以及 (f12)撷取该语音之该特征参数。 9.如申请专利范围第8项所述之方法,其中步骤(f11) 更包含下列步骤: 放大该语音信号; 对该语音信号正视化(normalization); 对该语音信号进行预强调(pre-emphasis); 将该语音乘上汉明窗(Hamming Window);以及 将该语音通过一低通滤波器或一高通滤波器。 10.如申请专利范围第8项所述之方法,其中步骤(f12) 更包含下列步骤: 对该语音进行快速傅立叶变换(Fast Fourier Transform, FFT)处理;以及 求取该语音之梅尔倒频谱参数(Mel-Frequency Cepstrum CoefficientS, MFCC)。 11.一种动态更新一辨识字汇和语言模型目录之方 法,该辨识字汇和语言模型目录系包含复数组辨识 字汇和语言模型,且用于一可选择句型之语音输入 装置,该可选择句型之语音输入装置更包含一内容 资料库及一辨识字汇和语言模型/索引建立单元, 其步骤系包含: (a)该内容资料库之一内容有所更动; (b)藉由该辨识字汇和语言模型/索引建立单元,将 该内容资料库之相关内容载入,并转成一辨识字汇 和语言模型以及一索引; (c)将该辨识字汇和语言模型储存于该辨识字汇和 语言模型目录中;以及 (d)将该索引储存于内容资料库中。 图式简单说明: 第一图所示为本案之可选择句型之语音输入装置 之一较佳实施例; 第二图所示为本案之可选择句型之语音输入装置 之硬体外观之一较佳实施例; 第三图所示为本案更新辨识字汇和语言模型之示 意图;以及 第四图所示为本案更新辨识字汇和语言模型之流 程图。
地址 桃园县龟山乡兴邦路31之1号