发明名称 基于视频的人脸实时检测方法及其装置
摘要 本发明涉及多媒体领域,公开了一种基于视频的人脸实时检测方法及其装置。本发明中,将视频图像帧分为全检测帧和预测检测帧两种类型的帧,根据当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔,判决当前输入的视频图像帧的类型,并采用相应的检测方式。由于视频序列在时空域具备可预测特性,因此对部分视频图像帧采用对不同区域以不同步长进行搜索的检测方式,能有效减少检测过程中需要搜索的次数,避免了一般的基于AdaBoost级联算法以固定步长搜索全部区域的缺陷,使得检测过程的计算复杂度大幅度降低,而且同样能保证检测的准确性。
申请公布号 CN102103694B 申请公布日期 2012.10.17
申请号 CN200910201999.5 申请日期 2009.12.21
申请人 展讯通信(上海)有限公司 发明人 罗小伟;林福辉
分类号 G06K9/46(2006.01)I;G06T7/60(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 上海明成云知识产权代理有限公司 31232 代理人 成春荣;竺云
主权项 一种基于视频的人脸实时检测方法,其特征在于,包含以下步骤:预先将视频图像帧分为全检测帧和预测检测帧两种类型的帧,所述全检测帧为以固定小步长,采用实时人脸检测算法对图像整个区域进行全搜索检测的图像帧,所述预测检测帧为基于预测,将图像帧的检测区域分割为人脸候选区域和非人脸区域,对人脸候选区域采用固定小步长,对非人脸区域采用固定大步长搜索检测的图像帧,所述固定大步长大于所述固定小步长;如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔大于预设阈值,则判定当前输入的视频图像帧为全检测帧,以所述全检测帧的检测方式进行检测;如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔小于或等于所述预设阈值,则判定当前输入的视频图像帧为预测检测帧,以所述预测检测帧的检测方式进行检测;在以所述全检测帧的检测方式或以所述预测检测帧的检测方式进行检测后,输出当前视频图像帧内所有检测到的人脸的区域位置;其中,第一个视频图像帧为全检测帧;通过以下方式实现所述基于预测,将图像帧的检测区域分割为人脸候选区域和非人脸区域:在以全检测帧的检测方式或以预测检测帧的检测方式对之前视频图像帧进行检测后,以之前视频图像帧内的人脸区域位置为基准,对该区域位置进行放大,将检测区域分割成人脸候选区域和非人脸区域。
地址 201203 上海市浦东张江高科技园区祖冲之路2288弄展讯中心1号楼