发明名称 用于语音识别系统的话音活动的视听检测
摘要 一种仅对声音语音发声进行响应的自动语音识别器(40)仅响应于具有与语音发声相关的频谱的声能和与语音发声相关的至少一个面部特征而被启动。在一个实施例中,讲话者必须直接面对着摄像机(12),并且多个讲话者的话音和面部特征必须匹配,才能启动自动语音识别器。
申请公布号 CN1623182A 申请公布日期 2005.06.01
申请号 CN03802828.X 申请日期 2003.01.29
申请人 皇家飞利浦电子股份有限公司 发明人 A·科梅纳雷兹;A·凯尔纳
分类号 G10L11/02;G10L15/24 主分类号 G10L11/02
代理机构 中国专利代理(香港)有限公司 代理人 刘红;张志醒
主权项 1.一种语音识别系统,包括:声音检测器(10),用于检测讲话者的语音发声;视觉检测器(12,26),用于检测与讲话者的语音发声相关的面部特征;处理装置(16,18,22,24,28,30,32,34,36,38),响应于声音和视频检测器而被连接,用于导出一个信号,该信号具有分别指示讲话者发出语音发声和未发出语音发声的第一和第二值,以致于响应于声音检测器检测到有限的非零声音响应、同时视觉检测器检测到与讲话者的语音发声相关的至少一个面部特征而导出第一值;和语音识别器(40),用于导出指示仅利用声音检测器检测到的语音发声的输出,该语音识别器被连接以响应该声音检测器,从而响应该信号具有第一值。
地址 荷兰艾恩德霍芬