发明名称 语音辨识系统及方法
摘要
申请公布号 TWI349266 申请公布日期 2011.09.21
申请号 TW096113155 申请日期 2007.04.13
申请人 佳世达科技股份有限公司 发明人 孙域晨;李昌鸿
分类号 G10L15/06 主分类号 G10L15/06
代理机构 代理人 祁明辉 台北市信义区忠孝东路5段510号22楼之2;林素华 台北市信义区忠孝东路5段510号22楼之2
主权项 一种用于语音辨识(Voice recognition)之方法,包含下列步骤:接受一使用者输入一语音;获得一目前位置资讯;根据该目前位置资讯获得相对应之一目前语音模型(Voice model);以及根据该目前语音模型对该语音进行语音辨识。如申请专利范围第1项所述之方法,其中该目前位置资讯系透过一全球定位系统(Global Positioning System,GPS)所获得。如申请专利范围第2项所述之方法,进一步包含下列步骤:预存一对照表(Look-up table)于一伺服端,该对照表包含复数个位置资讯,并且每个位置资讯对应一语音模型。如申请专利范围第3项所述之方法,其中根据该目前位置资讯获得相对应之该目前语音模型的步骤,进一步包含下列步骤:将该目前位置资讯传输至该伺服端;以该目前位置资讯匹配该对照表之该多个位置资讯,若有的话,则以该匹配的位置资讯所对应之语音模型作为该目前语音模型;以及自该伺服端下载该目前语音模型。如申请专利范围第1项所述之方法,其中根据该目前语音模型进行语音辨识的步骤,进一步包含下列步骤:利用该语音模型判断该语音是否为一现存语音,若是,则根据该现存语音产生相对应之一驱动讯号。如申请专利范围第1项所述之方法,其中该目前位置资讯系藉由一网际网路通讯协定位置(IP address)所获得。如申请专利范围第6项所述之方法,进一步包含下列步骤:预存一第一对照表(Look-up table),该第一对照表包含复数个网路资讯,并且每个网路资讯对应一位置资讯。如申请专利范围第7项所述之方法,其中藉由该网路资讯获得该目前位置资讯的步骤,进一步包含下列步骤:获得该网路资讯;以及以该网路资讯匹配该第一对照表中之该复数个网路资讯,若有的话,则以该匹配的网路资讯所对应之位置资讯做为该目前位置资讯。如申请专利范围第6项所述之方法,进一步包含下列步骤:预存一第二对照表于一伺服端,该第二对照表包含复数个位置资讯,并且每个位置资讯对应一语音模型。如申请专利范围第9项所述之方法,其中根据该目前位置资讯获得相对应之该目前语音模型的步骤,进一步包含下列步骤:将该目前位置资讯传输至该伺服端;以该目前位置资讯匹配该第二对照表之该多个位置资讯,若有的话,则以该匹配的位置资讯所对应之语音模型作为该目前语音模型;以及自该伺服端下载该目前语音模型。如申请专利范围第7项所述之方法,其中该网路资讯系一网际网路资讯通讯协定位置(IP address)资讯或一网域名称(Domain name)资讯。如申请专利范围第1项所述之方法,其中该目前位置资讯系一地理位置资讯。如申请专利范围第1项所述之方法,其中该目前语音模型包含一隐藏马可夫模型(Hidden Markov Model,HMM)。一种语音辨识(Voice recognition)系统,包含:一语音接收装置,可接收一使用者语音讯号;一定位装置(Positioning apparatus),用以提供一语音接收装置目前位置资讯;一第一记忆装置,储存复数个语音模型;一第二记忆装置,储存复数个位置资讯与该复数个语音模型之对应关系,并且每个位置资讯系对应到该复数个语音模型之一;以及一语音辨识单元(Processing apparatus),根据该语音接收装置目前位置资讯,将该第一记忆装置中相对应之该复数个语音模型之一设定为目前语音模型(Current Voice model),该语音辨识单元根据该目前语音模型对该使用者语音讯号进行语音辨识。如申请专利范围第14项所述之语音辨识系统,其中该定位装置进一步包含:一全球定位系统(Global Positioning System,GPS)收发装置,该定位装置(Positioning apparatus)会随着该语音接收装置移动,用以获得该语音接收装置目前位置之经纬度座标;其中该第二记忆装置所储存的复数个位置资讯系为复数个经纬度座标,并且每个经纬度座标对应到该复数个语音模型之一。如申请专利范围第14项所述之语音辨识系统,其中该语音接收装置与该语音辨识单元系连结于一网路上,且该语音接收装置具有一语音接收装置网路资讯,该语音接收装置透过该网路传送复数个网路封包到该语音辨识单元,每一网路封包具有部分该使用者语音讯号与该语音接收装置网路资讯,该定位装置进一步包含:一分析装置,用以分析该网路封包中的该语音接收装置网路资讯;其中该第二记忆装置所储存的复数个位置资讯系为复数个网路资讯,并且每个网路资讯对应到该复数个语音模型之一。如申请专利范围第16项所述之语音辨识系统,其中该语音接收装置网路资讯系为该语音接收装置所在的一网际网路资讯通讯协定位置(IP address)资讯或一网域名称(Domain name)资讯。如申请专利范围第14项所述之语音辨识系统,其中该第一记忆装置不会随着该语音接收装置移动,而该语音辨识单元会随着该语音接收装置移动,其中该语音辨识系统进一步包含:一通讯装置,用以于该语音辨识单元以及该第一记忆装置之间传递该目前语音模型。如申请专利范围第18项所述之语音辨识系统,其中该通讯装置包含一无线传输模组,其规格包含选自由IEEE 802.11规格、3G规格以及WiMax规格所组成之群组中之至少一。如申请专利范围第14项所述之语音辨识系统,其中该第二记忆装置不会随着该语音接收装置移动,而该定位装置会随着该语音接收装置移动,其中该语音辨识系统进一步包含:一通讯装置,用以于该定位装置以及该第二记忆装置之间传递该语音接收装置目前位置资讯。如申请专利范围第20项所述之语音辨识系统,其中该通讯装置包含一无线传输模组,其规格包含选自由IEEE 802.11规格、3G规格以及WiMax规格所组成之群组中之至少一。如申请专利范围第14项所述之语音辨识系统,其中该目前位置资讯系一地理位置资讯。
地址 桃园县龟山乡山莺路157号