发明名称 利用影像特征辅助语音遥控的装置及方法
摘要 一种利用影像特征辅助语音遥控的装置及方法,适用于具有影像及语音撷取功能的遥控设备,如数码相机、数码录放机、手术房摄录像机及一般的摄影手机等。所述装置的内部同时设有一语音特征库、一影像特征库及一指令库供语音遥控操作之用,且在执行语音遥控操作时,包括下列步骤:(a)通过一收音装置输入一语音,分析该语音特征搜寻一语音特征库,藉以找出相对的指令库中接近该语音特征的指令集;(b)通过影像撷取元件撷取一影像,并利用该影像特征搜寻一影像特征库;(c)利用影像特征库的搜寻结果复核指令集中哪一个是最接近合理的指令;及(d)执行该最接近合理的指令。此以影像特征复核语音指令的方法,可增加语音控制的准确度,并有效减少操作上的错误。
申请公布号 CN101038742A 申请公布日期 2007.09.19
申请号 CN200610058563.1 申请日期 2006.03.16
申请人 普立尔科技股份有限公司 发明人 洪进福
分类号 G10L15/00(2006.01);G10L15/08(2006.01);G10L15/28(2006.01);H04N5/225(2006.01);H04N5/232(2006.01) 主分类号 G10L15/00(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 任默闻
主权项 1、一种利用影像特征辅助语音遥控的装置,是在一影像撷取装置装设一语音辨识装置及一收音装置,利用该收音装置接收外界的语音指令进行遥控;其特征在于,所述语音辨识装置含有:一指令库,储存多个语音指令供操作所述影像撷取装置;一语音特征库,储存多个语音特征与所述指令库的指令对应,藉以挑出符合语音特征的指令成为一指令集;及一影像特征库,储存多个影像特征与所述指令库的指令对应。
地址 台湾省台北市