发明名称 多模态信息结合的多姿态三维人脸面部五官标志点定位方法
摘要 本发明公开了一种多模态信息结合的多姿态三维人脸面部五官标志点定位方法,用于解决现有的多姿态三维人脸面部五官标志点定位方法对姿态鲁棒性差的技术问题。技术方案是采用多模态信息结合进行三维人脸面部五官标志点定位,借助二维图像中五官结构轮廓清晰和三维人脸模型中五官标志区域凹凸分明的优势,能够不用预先对人脸模型的姿态进行估计和补偿,从而对姿态有着较强的鲁棒性,对正面三维人脸模型的五官标志点平均定位准确率达到98.5%,对姿态变化较小人脸模型,定位准确率由背景技术的88.3%提高到91.6%;对于姿态变化较大的人脸模型,本发明具有显著的优越性,定位准确率由背景技术的57.5%提高到73.5%。
申请公布号 CN102081733B 申请公布日期 2012.10.10
申请号 CN201110007180.2 申请日期 2011.01.13
申请人 西北工业大学 发明人 张艳宁;郭哲;林增刚;郗润平;梁君
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 黄毅新
主权项 1.一种多模态信息结合的多姿态三维人脸面部五官标志点定位方法,其特征在于包括下述步骤:(a)对人脸二维纹理图像进行特征点检测,将每幅人脸二维纹理图像对由前视位置绕相机光轴方向变化产生的图像形变失真进行精确仿真,倾斜转换度由定向的t子采样,仿真图像依照<img file="FSB00000863131000011.GIF" wi="194" he="126" />进行φ旋转,在x方向采用标准偏差<img file="FSB00000863131000012.GIF" wi="157" he="61" />的高斯函数对图像进行卷积操作,c=0.8;式中,φ是相机经度角,θ是相机纬度角;对形变变量通过相机经度角φ和相机纬度角θ调节;对所有仿真图像进行比较,提取出的特征点中抽取最具有代表性的五官特征描述点;(b)将人脸二维纹理图像中检测出的五官特征描述点U={u<sub>i</sub>∈R<sup>2</sup>:i=1,2,…,N},R<sup>2</sup>表示二维数据空间,根据相应关系映射到三维人脸模型中;二维图像中非人脸区域内检测出的五官特征描述点在三维人脸数据中对应点的特征值为0,即非人脸区域,将非人脸区域点从三维人脸数据中剔除;对三维人脸模型数据集P{p<sub>i</sub>,i=1,2,...,N}中的每一个顶点p<sub>i</sub>,其最大和最小曲率分别表示为<img file="FSB00000863131000013.GIF" wi="53" he="63" />和<img file="FSB00000863131000014.GIF" wi="88" he="64" />能够描述曲面结构的重要信息,而由最大最小曲率计算出的三维曲面上的脊线和谷线能够较好地描述人脸五官区域的凹凸变化,分别以l<sub>ridge</sub>和l<sub>valley</sub>表示,其计算原则为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>l</mi><mi>ridge</mi></msub><mo>=</mo><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><mi>if</mi><mrow><mo>(</mo><msub><mi>k</mi><msub><mn>1</mn><mi>pi</mi></msub></msub><mo>></mo><msub><mi>k</mi><mrow><mi>thresh</mi><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>p</mi><mi>i</mi></msub><mo>&Element;</mo><mi>P</mi><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>l</mi><mi>valley</mi></msub><mo>=</mo><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><mi>if</mi><mrow><mo>(</mo><msub><mi>k</mi><msub><mn>2</mn><mi>pi</mi></msub></msub><mo>&lt;</mo><msub><mi>k</mi><mrow><mi>thresh</mi><mn>2</mn></mrow></msub><mo>)</mo></mrow><mo>|</mo><msub><mi>p</mi><mi>i</mi></msub><mo>&Element;</mo><mi>P</mi><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中k<sub>thresh1</sub>、k<sub>thresh2</sub>分别为局部区域的门限曲率,其值由遗传算法计算得出;由以上谷线和脊线的计算原则,能分别得到人脸五官区域位置的谷线和脊线;假设映射到三维空间的面部区域特征点集由<img file="FSB00000863131000017.GIF" wi="582" he="86" />表示,在该集合中按照式(1)和(2)计算满足脊线和谷线的点,并保留相应的脊线和谷线;令特征点集P<sub>F</sub>内的脊线和谷线分别标记为P<sub>F|ridge</sub>,P<sub>F|valley</sub>,并将两集合合并为P<sub>F|mark</sub>,表示人脸五官的局部突变点集;(c)Step1:分别对不同姿态三维人脸数据集M<sub>f</sub>和M<sub>nf</sub>的突变点集合P<sub>F|mark</sub><sup>f</sup>和P<sub>F|mark</sub><sup>nf</sup>中的每一个标志点p<sub>i,F|mark</sub><sup>f</sup>,p<sub>j,F|mark</sub><sup>nf</sup>,建立形状编码,并比较M<sub>f</sub>和M<sub>nf</sub>特征点对间的约束关系<maths num="0003"><![CDATA[<math><mrow><mi>R</mi><mo>=</mo><mo>{</mo><msup><msub><mi>p</mi><mrow><mi>i</mi><mo>,</mo><mi>F</mi><mo>|</mo><mi>mark</mi></mrow></msub><mi>f</mi></msup><mo>&LeftRightArrow;</mo><msup><msub><mi>p</mi><mrow><mi>j</mi><mo>,</mo><mi>F</mi><mo>|</mo><mi>mark</mi></mrow></msub><mi>nf</mi></msup><mo>|</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>&Element;</mo><mi>N</mi><mo>}</mo><mo>;</mo></mrow></math>]]></maths>Step2:对R建立的点对约束,计算P<sub>F|mark</sub><sup>f</sup>和P<sub>F|mark</sub><sup>nf</sup>各点的匹配误差D(p<sub>i,F|mark</sub><sup>f</sup>,p<sub>j,F|mark</sub><sup>nf</sup>),统计出偏差阈值τ;Step3:去除P<sub>F|mark</sub><sup>f</sup>和P<sub>F|mark</sub><sup>nf</sup>中误差值大于偏差阈值τ的点,建立新的集合P<sub>F|mark</sub><sup>f′</sup>和P<sub>F|mark</sub><sup>nf′</sup>,转Step2,若相邻两次阈值差小于给定误差值,迭代结束;Step4:P<sub>F|mark</sub><sup>f′</sup>和P<sub>F|mark</sub><sup>nf′</sup>即是相应人脸数据模型中的五官标志点。
地址 710072 陕西省西安市友谊西路127号