发明名称 语音辨识方法
摘要 本案系指一种语音辨识方法,其系利用一个人对机器下语音指令时,如果第一次无法被接受,通常会以同样的语音指令再说一次或数次这种重复输入语音指令的使用惯,使得连续两次或数次被拒绝的结果能透过本案之语音辨识方法做适当的补救,以提高语音辨识系统的正确率。
申请公布号 TWI225638 申请公布日期 2004.12.21
申请号 TW092126732 申请日期 2003.09.26
申请人 台达电子工业股份有限公司 发明人 沈家麟
分类号 G10L15/28 主分类号 G10L15/28
代理机构 代理人 蔡清福 台北市中正区忠孝东路一段一七六号九楼
主权项 1.一种语音辨识方法,包括下列步骤:(a)于一第一时间提供一第一语音信号,并因应该第一语音信号产生一第一候选词及一第一识别分数;(b)判断该第一识别分数是否大于一第一门槛値,若否,则进行步骤(c);(c)判断该第一识别分数是否大于一第二门槛値,若是,则储存该第一语音信号,并进行步骤(d);(d)于一第二时间提供一第二语音信号,并因应该第二语音信号产生一第二候选词及一第二识别分数;(e)判断该第二识别分数是否大于该第一门槛値,若否,则进行步骤(f);(f)判断该第二识别分数是否大于该第二门槛値,若是,则进行步骤(g);(g)判断下列二种情况是否同时成立,(g1)该第二时间减去该第一时间所得结果小于一时间额定値;以及(g2)该第二候选词与该第一候选词相同;若是,则进行步骤(h);(h)取出已储存之该第一语音信号并将其与该第二语音信号作比对,以产生一比对分数;以及(i)判断该比对分数是否大于一第三门槛値,若是,则输出该第一候选词。2.如申请专利范围第1项所述之语音辨识方法,其中该第一门槛値大于该第二门槛値。3.如申请专利范围第1项所述之语音辨识方法,其中该第一语音信号与该第二语音信号之内容完全相同。4.如申请专利范围第1项所述之语音辨识方法,其中步骤(b)更包括另一步骤:若该第一识别分数大于该第一门槛値,则输出该第一候选词。5.如申请专利范围第1项所述之语音辨识方法,其中步骤(c)更包括另一步骤:若该第一识别分数并非大于该第二门槛値,则结束该语音辨识方法。6.如申请专利范围第1项所述之语音辨识方法,其中步骤(e)更包括另一步骤:若该第二识别分数大于该第一门槛値,则清除已储存之该第一语音信号并输出该第二候选词。7.如申请专利范围第1项所述之语音辨识方法,其中步骤(f)更包括另一步骤:若该第二识别分数并非大于该第二门槛値,则结束该语音辨识方法。8.如申请专利范围第1项所述之语音辨识方法,其中步骤(g)更包括另一步骤:若(g1)与(g2)二种情况并非同时成立,则清除已储存之该第一语音信号,并储存该第二语音信号,且于一第三时间提供一第三语音信号,再利用该第二语音信号及该第三语音信号重覆步骤(d)~(g)。9.如申请专利范围第8项所述之语音辨识方法,其中该第一语音信号、该第二语音信号及该第三语音信号之内容完全相同。10.如申请专利范围第1项所述之语音辨识方法,其中步骤(h)将该第一语音信号及该第二语音信号作比对所采用之方式系包括但不限于隐藏式马可夫模型(Hidden Markov Model)、动态时域比对法(Dynamic TimeWarping)、以及类神经网路(Neutral Network)。11.如申请专利范围第1项所述之语音辨识方法,其中步骤(i)更包括下列步骤其中之一:(i1)若该比对分数并非大于该第三门槛値,则结束该语音辨识方法;以及(i2)若该比对分数并非大于该第三门槛値,则清除已储存之该第一语音信号,并储存该第二语音信号,且于一第四时间提供一第四语音信号,再利用该第二语音信号及该第四语音信号重覆步骤(d)~(i)。12.如申请专利范围第11项所述之语音辨识方法,其中步骤(i2)中之该第一语音信号、该第二语音信号及该第四语音信号之内容完全相同。13.一种语音辨识方法,包括下列步骤:(a)于一第一时间提供一第一语音信号,并因应该第一语音信号产生一第一候选词及一第一识别分数;(b)判断该第一识别分数是否大于一第一门槛値,若否,则进行步骤(c);(c)判断该第一识别分数是否大于一第二门槛値,若是,则储存该第一语音信号,并进行步骤(d);(d)于一第二时间提供一第二语音信号,并因应该第二语音信号产生一第二候选词及一第二识别分数;(e)判断该第二识别分数是否大于该第一门槛値,若否,则进行步骤(f);(f)判断该第二识别分数是否大于该第二门槛値,若是,则进行步骤(g);(g)判断下列二种情况是否同时成立,(g1)该第二时间减去该第一时间所得结果小于一时间额定値;以及(g2)该第二候选词与该第一候选词相同;若是,则进行步骤(h);(h)取出已储存之该第一语音信号并将其与该第二语音信号作比对,以产生一第一比对分数;以及(i)判断该第一比对分数是否大于一第三门槛値,若否,则储存该第二语音信号,并进行步骤(j);(j)于一第三时间提供一第三语音信号,再利用该第二语音信号及该第三语音信号重覆步骤(d)~(g);(k)取出已储存之该第一语音信号及该第二语音信号,并将其与该第三语音信号作交叉比对,以产生一第二比对分数;(l)判断该第二比对分数是否大于该第三门槛値,若是,则输出该第一候选词。14.如申请专利范围第13项所述之语音辨识方法,其中该第一门槛値大于该第二门槛値。15.如申请专利范围第13项所述之语音辨识方法,其中该第一语音信号、该第二语音信号与该第三语音信号之内容完全相同。16.如申请专利范围第13项所述之语音辨识方法,其中步骤(b)更包括另一步骤:若该第一识别分数大于该第一门槛値,则输出该第一候选词。17.如申请专利范围第13项所述之语音辨识方法,其中步骤(c)更包括另一步骤:若该第一识别分数并非大于该第二门槛値,则结束该语音辨识方法。18.如申请专利范围第13项所述之语音辨识方法,其中步骤(e)更包括另一步骤:若该第二识别分数大于该第一门槛値,则清除已储存之该第一语音信号并输出该第二候选词。19.如申请专利范围第13项所述之语音辨识方法,其中步骤(f)更包括另一步骤:若该第二识别分数并非大于该第二门槛値,则结束该语音辨识方法。20.如申请专利范围第13项所述之语音辨识方法,其中步骤(g)更包括另一步骤:若(g1)与(g2)二种情况并非同时成立,则清除已储存之该第一语音信号,并储存该第二语音信号,且于一第四时间提供一第四语音信号,再利用该第二语音信号及该第四语音信号重覆步骤(d)~(g)。21.如申请专利范围第20项所述之语音辨识方法,其中该第一语音信号、该第二语音信号及该第四语音信号之内容完全相同。22.如申请专利范围第13项所述之语音辨识方法,其中步骤(h)将该第一语音信号及该第二语音信号作比对系所采用之方式系包括但不限于隐藏式马可夫模型(Hidden Markov Model)、动态时域比对法(DynamicTime Warping)、以及类神经网路(Neutral Network)。23.如申请专利范围第13项所述之语音辨识方法,其中步骤(i)更包括另一步骤:若该第一比对分数大于该第三门槛値,则输出该第一候选词。24.如申请专利范围第13项所述之语音辨识方法,其中步骤(k)将该第一语音信号、该第二语音信号及该第三语音信号作交叉比对所采用之方式系包括但不限于隐藏式马可夫模型(Hidden Markov Model)、动态时域比对法(Dynamic Time Warping)、以及类神经网路(Neutral Network)。25.如申请专利范围第13项所述之语音辨识方法,其中步骤(1)更包括另一步骤:若该第二比对分数并非大于该第三门槛値,则结束该语音辨识方法。图式简单说明:第一图:一种传统的语音辨识系统示意图;第二图:本案语音辨识系统一较佳实施例之方块图;以及第三图:第二图之再确认机制之流程图。
地址 台北市内湖区瑞光路一八六号