发明名称 用于不利环境中东方字元之混合式键盘/语音辨识技术
摘要 本发明所揭露的是一种高精确度的东方语言,如中文,输入方法和装置,用于不利环境中具少量键盘及/或少量记忆体之小尺寸电子装置,如个人数位助理器(PDA)、行动电话、电子字典、及电子表。此乃藉由将每一个多音节中文字元发音成隔离之声调音节,其中隔离之声调音节中的母音及子音系在按下特别设计之键盘时藉由自动语音辨识予以分离,例如一含有一音节(子音或母音)之第一音位以进一步分辨不利环境中拼音读法之声学实现所衍生之模糊话语(次字词单元),例如子音。若模糊话语仍然存在则有必要按下第二或第三个音节之拼音读法。键盘设计系呈一资料驱动方式使得每一个键盘内部之音位类似性比率达到最小且键盘之间的拼音读法类似性比率达到最大。
申请公布号 TW533404 申请公布日期 2003.05.21
申请号 TW090128512 申请日期 2001.11.16
申请人 皇家飞利浦电子股份有限公司 发明人 黄昶翰
分类号 G10L15/02 主分类号 G10L15/02
代理机构 代理人 陈长文 台北市松山区敦化北路二○一号七楼
主权项 1.一种电子装置,其系用于一东方语言中所说出的语音,该所说出的语音之音节结构为子音加上母音加上音调或母音加上音调,该电子装置包含:一语音接收器,该语音接收器系用于接收一代表该所说出语音之语音信号;一预处理构件,该预处理构件系耦接至该语音接收器,用于撷取该语音信号的语音特征;一含有许多按键的键盘构件,其中每一个按键系指定至少一含有子音与母音的音位;声学匹配构件,其系基于该语音信号之语音特征和经由该键盘构件依序取得之音位用于辨识该所说出语音的每一个音节;以及隔离音节匹配构件,其系基于每一个来自该声学匹配构件之音节和经由该键盘构件依序键入之音位辨识该所说出语音内每一个由许多音节所组成的字词。2.如申请专利范围第1项之电子装置,其中每一个按键皆指定至少一音位,其方式系使群聚于许多按键中每一个按键内之音位之平方距离和对许多按键中之音位之平方距离和的比値达到最大。3.如申请专利范围第1项之电子装置,其中对应于所说出语音中每一个音节之第一音位(最好为子音)的按键系在发出每一个音节时予以按下。4.如申请专利范围第1项之电子装置,其中该电子装置系选自由一行动电话、无线电话、电子字典、一个人数位助理器、以及一电子表所组成之群集。5.如申请专利范围第1项之电子装置,其中该所说出的语音系一种由至少一多音节字词所组成之隔离语音。6.如申请专利范围第3项之电子装置,其中所说出语音中每一个音节的第一音位系一子音。7.一种具有一显示器的电子装置,其包含:一语音接收构件,其系用于接收一代表一东方语言中所说出语音之语音信号,其具有子音加上母音或母音其中之一的音节结构;一具有许多按键的数字键盘,其中至少一含有子音和母音的音位系指定至并明显地标示于或邻近许多按键中的每一个按键;一语音辨识构件,其系基于经由该数字键盘依序取得之音位和藉由该语音接收构件所接收之所说出语音用于辨识来自该所说出语音的东方字元;以及用于将来自该所说出语音之东方字元显示出来的构件。8.如申请专利范围第7项之具有一显示器的电子装置,其中至少一音位系指定至许多按键中的每一个按键,其方式系使群聚于许多按键中每一个按键内之许多音位之平方距离和对许多按键中许多音位之平方距离和的比値达到最大,而使得东方语言可经由该数字键盘和该语音接收构件有效输入。9.一种辨识一东方语言中语音的方法,其系经由一数字键盘藉由按键输入予以协助,其中该东方语音的音节结构为子音加上母音或母音且其中该数字键盘具有许多按键,该方法包含步骤如下:(a)输入一代表该语音的语音信号;(b)撷取该语音信号的语音特征;(c)经由该数字键盘在发出每一个音节时依序接收对应于该语音中每个音节之第一音位的按键资讯;(d)基于自步骤(c)依序接收之音位和该语音信号之语音特征辨识该语音之每一个音节;以及(e)基于自步骤(c)依序接收之音位和于步骤(d)中辨识到的每一个音节辨识该语音内每一个由许多音节所组成之字词。10.如申请专利范围第9项之方法,其中该数字键盘之许多按键中的每一个按键皆指定至少一含有子音和母音的音位且步骤(c)中的该第一音位系一子音。11.一种群聚一电子装置之数字键盘内含有子音和母音之东方语言之许多音位的方法,其中至少一音位系指定至键盘之许多按键中的每一个按键,包含步骤如下:(a)取得许多音位之声学特征;以及(b)依一资料驱动方式使群聚于许多按键中每一个按键内之许多音位之平方距离和对许多按键中许多音位之平方距离和的比値达到最大。12.如申请专利范围第11项之方法,其中该最大化步骤含有如下步骤:(b1)使每一个按键内此等音位之声学特征空间中之第一非类似性量测达到最大而使得群聚于每个按键之许多音位在声学上得以区分;以及(b2)使按键中音位之声学特征空间之第二非类似性量测达到最小而使得大部分模糊之音位未群聚于相同的按键内。13.如申请专利范围第11项之方法,其中东方语言为中国话,以及该电子装置的数字键盘具有十二个按键,且其中该等十二个按键内许多中文音位的群集系提供如下:1 (ㄒㄝㄈ)2 (ㄙㄦㄖ)3 (ㄕㄛㄌ)4 (ㄑㄚㄩ)5 (ㄗㄡㄨㄜ)6 (ㄘㄢㄧ)7 (ㄓㄣㄆ)8 (ㄏㄤㄊ)9 (ㄐㄥㄎ)0 (ㄔㄅㄞ)# (ㄋㄍㄠ)14.一种将东方字元输入至一电子装置的方法,该电子装置具有一由许多按键和一语音输入构件所组成的数字键盘,其特征为至少有一含有子音与母音的音位系指定至并明显地标示于或邻近许多按键中的每一个按键;其中一代表该等东方字元的语音系由一使用者说出并由该语音输入构件所接收,且该使用者在使用者依一隔离语音模式发出该等东方字元中的每一个子元时依序按下一代表此等对应于该等东方字元中每一个字元的音位中之第一音位的按键;以及其中此等对应之东方字元系以依序键入的音位为基础来作选择。15.如申请专利范围第14项之方法,其特征为至少有一音位系指定至许多按键中的每一个按键,其方式系使群聚于许多按键中每一个按键内之许多音位之平方距离和对许多按键中之许多音位之平方距离和的比値达到最大。16.一种电脑程式产品,其操作系使一处理器执行许多步骤以经由一数字键盘辨识藉由按键输入所协助之东方语言之语音,其中该东方语音之音节结构为子音加上母音或母音且其中该数字键盘具有许多按键,该等许多步骤包含:(a)输入一代表该语音的语音信号;(b)撷取该语音信号的语音特征;(c)在发出每一个音节时经由该数字键盘依序接收对应于该语音中每一个音节之第一音位的按键资讯;(d)基于该语音信号之语音特征和自步骤(c)依序接收到的音节辨识该语音之每一个音节;以及(c)基于在步骤(d)中所辨识之每一个音节和自步骤(c)依序接收之音位辨识该语音内每一个由许多音节所组成的字词。17.如申请专利范围第16项之电脑产品,其中该数字键盘之许多按键中的每一个按键系指定至少一含有该东方语言之子音与母音的音位且步骤(c)中该第一音位系一子音。图式简单说明:图1系一传统大型单字连续性语音辨识(LVCSR)系统之概要方块图。图2系一电子装置之概要性描述,其根据本发明对拼音字元利用混合式键盘∕语音辨识技术。图3系一混合式键盘∕语音辨识系统之概要方块图,其系用于示于图2之电子装置中。图4系一种辨识东方语言之语音之方法的流程图,其系经由用于图3之数字键盘藉由按键输入予以促进。
地址 荷兰
您可能感兴趣的专利