发明名称 一种基于视觉唤醒的语音控制方法
摘要 本发明公开了一种基于视觉唤醒的语音控制方法,用于唤醒语音控制设备以使该语音控制设备对其接收的语音信号做出回复。本发明的语音控制方法包括语音控制设备接收到至少部分的语音信号后,启动安装在其上的图像接收单元;图像接收单元获取图像并传送到图像识别单元;图像识别单元识别图像,当在图像中检测到视线朝向该语音控制设备的人脸时,语音控制设备被唤醒以识别语音信号。本发明通过搜索视线朝向该语音控制设备的人脸的视觉唤醒功能来唤醒语音识别单元,更符合使用者的日常语音交互惯,使用更为方便、智能。
申请公布号 CN105204628A 申请公布日期 2015.12.30
申请号 CN201510551221.2 申请日期 2015.09.01
申请人 涂悦 发明人 涂悦
分类号 G06F3/01(2006.01)I;G10L15/22(2006.01)I 主分类号 G06F3/01(2006.01)I
代理机构 上海旭诚知识产权代理有限公司 31220 代理人 郑立
主权项 一种基于视觉唤醒的语音控制方法,用于唤醒语音控制设备以使所述语音控制设备对其接收的语音信号做出回复,其特征在于,所述语音控制方法包括:步骤一、语音控制设备接收到至少部分的所述语音信号后,启动安装在其上的图像接收单元;步骤二、所述图像接收单元获取图像并传送到图像识别单元;步骤三、所述图像识别单元识别所述图像,当在所述图像中检测到视线朝向所述语音控制设备的人脸时,所述语音控制设备被唤醒以识别所述语音信号。
地址 200011 上海市黄浦区瞿溪路501弄4号402室