发明名称 照片人脸与活体人脸的计算机自动鉴别方法
摘要 本发明公开了一种照片人脸与活体人脸的计算机自动鉴别方法,其步骤如下:(1)人脸检测与眼睛定位;(2)眼部区域截取;(3)从归一化处理后的图像中计算眼睛的开合程度;(4)运用条件随机场理论建立用于判断眨眼动作的模型;(5)将待鉴别的视频中每一帧图像按照步骤(1)~(3)的过程进行处理,运用步骤(4)中的模型和条件随机场理论的推理方法,判断出待鉴别的视频中是否存在眨眼动作,完成对照片人脸与活体人脸进行自动鉴别。本发明实现了通过单个摄像头进行照片人脸和活体人脸的计算机自动鉴别。
申请公布号 CN100592322C 申请公布日期 2010.02.24
申请号 CN200810059027.2 申请日期 2008.01.04
申请人 浙江大学 发明人 吴朝晖;潘纲;孙霖
分类号 G06K9/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 代理人 胡红娟
主权项 1、一种照片人脸与活体人脸的计算机自动鉴别方法,其步骤如下:(1)人脸检测与眼睛定位使用Haar类似特征与级联Adaboost方法对输入视频的每一帧图像进行人脸位置检测,截取人脸图片并定位出眼睛中心;(2)眼部区域截取以眼睛中心为中心,截取眼部图像,将该眼部图像作归一化处理,得到归一化处理后的图像;(3)从归一化处理后的图像中计算眼睛的开合程度眼睛开合程度x(I)的计算公式:<maths num="0001"><![CDATA[<math><mrow><mi>x</mi><mrow><mo>(</mo><mi>I</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><mi>log</mi><mrow><mo>(</mo><mfrac><mn>1</mn><msub><mi>&beta;</mi><mi>i</mi></msub></mfrac><mo>)</mo></mrow><mo>*</mo><msub><mi>h</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>I</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><mi>log</mi><mfrac><mn>1</mn><msub><mi>&beta;</mi><mi>i</mi></msub></mfrac></mrow></math>]]></maths>I是截取的眼部样本图像;h<sub>i</sub>(I)是二值弱分类器,定义为<maths num="0002"><![CDATA[<math><mrow><mi>h</mi><mrow><mo>(</mo><mi>I</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mi>if</mi></mtd><mtd><mi>pf</mi><mrow><mo>(</mo><mi>I</mi><mo>)</mo></mrow><mo>&lt;</mo><mi>p&theta;</mi></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd></mtd><mtd><mi>otherwise</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>其中f(I)是Haar类似特征函数,θ是阈值,p表示不等号的方向;弱分类器的加权值β和阈值θ通过Adaboost算法对正样本和负样本训练得到;N表示二值弱分类器h<sub>i</sub>的个数;(4)运用条件随机场理论建立用于判断眨眼动作的模型模型中的条件概率分布函数如下,<maths num="0003"><![CDATA[<math><mrow><msub><mi>P</mi><mi>&theta;</mi></msub><mrow><mo>(</mo><mi>Y</mi><mo>|</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><msub><mi>Z</mi><mi>&theta;</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow></mrow></mfrac><mi>exp</mi><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mi>i</mi></munder><msub><mi>&lambda;</mi><mi>i</mi></msub><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>t</mi></msub><mo>,</mo><msub><mi>y</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mi>j</mi></munder><msub><mi>&mu;</mi><mi>j</mi></msub><msub><mi>g</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>t</mi></msub><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>&theta;</mi></msub><mrow><mo>(</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mi>Y</mi></munder><mi>exp</mi><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mi>i</mi></munder><msub><mi>&lambda;</mi><mi>i</mi></msub><msub><mi>f</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>t</mi></msub><mo>,</mo><msub><mi>y</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mi>j</mi></munder><msub><mi>&mu;</mi><mi>j</mi></msub><msub><mi>g</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>y</mi><mi>t</mi></msub><mo>,</mo><mi>X</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow></mrow></math>]]></maths>X={x<sub>1</sub>,...,x<sub>T</sub>},Y={y<sub>1</sub>,...,y<sub>T</sub>},X是一观察序列,x<sub>i</sub>是根据步骤(3)的眼睛开合程度x(I)的计算公式得到的眼睛的开合程度值,Y是一状态序列,y<sub>i</sub>∈{α,β,γ},α表示睁开状态,β表示睁开与闭住之间的过渡状态,γ表示闭住状态,λ和μ表示各特征函数在概率估计中的权重;f<sub>i,</sub>,g<sub>i</sub>分别是状态的特征函数和观察-状态特征函数,定义如下:f<sub>i</sub>(y<sub>t,</sub>y<sub>t-1</sub>,X)=[y<sub>t</sub>=l][y<sub>t-1</sub>=l′]g<sub>j</sub>(y<sub>t</sub>,X)=[y<sub>t</sub>=l]x<sub>t-w</sub>w∈[-W,+W],W表示观察值之间存在前后依赖关系的窗口大小;(5)将待鉴别的视频中每一帧图像按照步骤(1)~(3)的过程进行处理,运用步骤(4)中的模型和条件随机场理论的推理方法,判断出待鉴别的视频中是否存在眨眼动作,完成对照片人脸与活体人脸进行自动鉴别;其中判断待鉴别的视频中是否存在眨眼动作的条件是状态序列Y中包含<img file="C2008100590270003C1.GIF" wi="366" he="74" />子序列,其中<img file="C2008100590270003C2.GIF" wi="107" he="74" />表示1个或者多个γ,这里的Y是使用向前-向后算法推理出的使得p<sub>θ</sub>取得最大值时的眼睛状态序列。
地址 310027浙江省杭州市西湖区浙大路38号