发明名称 利用影像撷取模组之语音辨识系统
摘要 本发明揭露一种语音辨识系统,用以辨识关于一语音输入之一目标字元。语音辨识系统包含一记忆单元、一语音接收模组、一影像撷取模组以及一决定模组。记忆单元用以储存一语音/字元资料库以及一影像/字元资料库。语音接收模组用以接收关于语音输入之语音信号,并且根据语音/字元资料库,将语音信号转换为一第一字元。影像撷取模组用以撷取关于语音输入之影像信号,并且根据影像/字元资料库,将影像信号转换为一第二字元。决定模组分别与语音接收模组以及影像撷取模组相耦合,并且用以根据第一字元与第二字元,决定出目标字元。
申请公布号 TWI275073 申请公布日期 2007.03.01
申请号 TW094141057 申请日期 2005.11.23
申请人 华宝通讯股份有限公司 发明人 黄宏吉
分类号 G10L15/24(2006.01) 主分类号 G10L15/24(2006.01)
代理机构 代理人 陶霖 台北县中和市中正路738号11楼之5
主权项 1.一种语音辨识系统(Speech recognition system),用以辨 识关于一语音输入之一目标字元(Character),该系统 包含: 一记忆单元(Memory unit),用以储存一语音/字元资料 库(Voice/character database)以及一影像/字元资料库( Image/character database); 一语音接收模组(Voice receiving module),用以接收关于 该语音输入之一语音信号,并且根据该语音/字元 资料库,将该语音信号转换为一第一字元; 一影像撷取模组(Image capturing module),用以撷取关于 该语音输入之一影像信号,并且根据该影像/字元 资料库,将该影像信号转换为一第二字元;以及 一决定模组(Determining module),分别与该语音接收模 组以及该影像撷取模组相耦合,用以根据该第一字 元与该第二字元,决定出该目标字元。 2.如申请专利范围第1项所述之系统,其中该第一字 元以及该第二字元系为同一字元。 3.如申请专利范围第1项所述之系统,进一步包含一 显示模组(Display module),用以显示关于该语音输入 之该目标字元。 4.如申请专利范围第1项所述之系统,其中该语音接 收模组为一行动通讯装置(Mobile communication apparatus )之一录音装置(Recording device)。 5.如申请专利范围第1项所述之系统,其中该影像撷 取模组为一行动通讯装置之一数位相机(Digital Camera)。 6.如申请专利范围第1项所述之系统,其中关于该语 音输入之该影像信号系由发出该语音输入之口形 撷取而得。 7.一种语音辨识方法(Speech recognition method),用以辨 识关于一语音输入之一目标字元(Character),该方法 包含下列步骤: (a)储存一语音/字元资料库(Voice/character database)以 及一影像/字元资料库(Image/character database); (b)接收关于该语音输入之一语音信号,并且根据该 语音/字元资料库,将该语音信号转换为一第一字 元; (c)撷取关于该语音输入之一影像信号,并且根据该 影像/字元资料库,将该影像信号转换为一第二字 元;以及 (d)根据该第一字元与该第二字元,决定出该目标字 元。 8.如申请专利范围第7项所述之方法,其中该第一字 元以及该第二字元系为同一字元。 9.如申请专利范围第7项所述之方法,进一步包含下 列步骤: (e)显示关于该语音输入之该目标字元。 10.如申请专利范围第7项所述之方法,其中关于该 语音输入之该语音信号系藉由一行动通讯装置( Mobile communication apparatus)之一录音装置(Recording device)而接收。 11.如申请专利范围第7项所述之方法,其中关于该 语音输入之该影像信号系藉由一行动通讯装置之 一数位相机(Digital Camera)而撷取。 12.如申请专利范围第7项所述之方法,其中关于该 语音输入之该影像信号系由发出该语音输入之口 形撷取而得。 图式简单说明: 图一为根据本发明一第一较佳具体实施例之语音 辨识系统之功能方块图。 图二为根据本发明第一较佳具体实施例之语音辨 识方法之流程图。
地址 台北市松山区八德路4段319号7楼