发明名称 基于统计形状理论的非线性面部运动流形学方法
摘要 本发明一种基于统计形状理论的非线性面部运动流形学方法,其中基于统计形状理论对面部形状的预处理方法描述如下:(1)对面部运动序列中的每一帧形状进行①去均值②归一化③复数化处理;(2)去掉复数表示中的冗余信息;(3)结合黎曼几何切空间映射,将复数表示的面部运动序列投影至运动流形的切空间,形成面部运动轨迹。其中面部流形学方法采用高斯过程隐变量模型,具体方法描述如下:(1)计算高斯过程的均值及协方差函数,确定所构造的高斯过程的概率密度函数;(2)用尺度共轭梯度法(Scaled Conjugate Gradient)求解隐变量,进而得到对应面部运动轨迹的降维结果。该方法采用真实的流形距离并采用优秀的降维方法对面部运动数据进行维数约减,从而更准确的描述面部运动流形的结构。
申请公布号 CN102289664A 申请公布日期 2011.12.21
申请号 CN201110216455.3 申请日期 2011.07.29
申请人 北京航空航天大学 发明人 毛峡;王晓侃
分类号 G06K9/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 代理人
主权项 1.一种基于统计形状理论的非线性面部运动流形学习方法,其特征在于:该方法包括基于统计形状理论的预处理及采用高斯过程隐变量模型的面部运动流形学习两个部分;其中:(1)关于基于统计形状理论的预处理,其步骤如下:Ω={ω<sub>i</sub>|i=1,2...N}为一个面部形状运动序列,其中ω<sub>i</sub>={(x<sub>i1</sub>,y<sub>i1</sub>),(x<sub>i2</sub>,y<sub>i2</sub>)...(x<sub>iM</sub>,y<sub>iM</sub>)}表示由M个点组成的一帧面部形状:步骤1:对面部运动序列Ω中的每一帧形状作去均值处理,首先得到每一帧面部形状的中心位置(x<sub>0</sub>,y<sub>0</sub>),<img file="FDA0000079647790000011.GIF" wi="287" he="125" /><img file="FDA0000079647790000012.GIF" wi="297" he="125" />然后从形状数据中去掉中心位置信息,即x<sub>ij</sub>′=x<sub>ij</sub>-x<sub>0</sub>,y<sub>ij</sub>′=y<sub>ij</sub>-y<sub>0</sub>使<maths num="0001"><![CDATA[<math><mrow><munder><mi>&Sigma;</mi><mi>j</mi></munder><msup><msub><mi>x</mi><mi>ij</mi></msub><mo>&prime;</mo></msup><mo>+</mo><munder><mi>&Sigma;</mi><mi>j</mi></munder><msup><msub><mi>y</mi><mi>ij</mi></msub><mo>&prime;</mo></msup><mo>=</mo><mn>0</mn><mo>;</mo></mrow></math>]]></maths>步骤2:对面部运动序列Ω中的每一帧形状作归一化处理,首先计算每帧形状到中心位置(经过去均值处理后,中心位置既为原点)距离的平方和<img file="FDA0000079647790000014.GIF" wi="363" he="125" />然后使用L对形状数据进行归一化,即<maths num="0002"><![CDATA[<math><mrow><msup><msub><mi>x</mi><mi>ij</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>=</mo><mfrac><msup><msub><mi>x</mi><mi>ij</mi></msub><mo>&prime;</mo></msup><msqrt><mi>L</mi></msqrt></mfrac><mo>,</mo></mrow></math>]]></maths><maths num="0003"><![CDATA[<math><mrow><msup><msub><mi>y</mi><mi>ij</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msup><mo>=</mo><mfrac><msup><msub><mi>y</mi><mi>ij</mi></msub><mo>&prime;</mo></msup><msqrt><mi>L</mi></msqrt></mfrac></mrow></math>]]></maths>使<maths num="0004"><![CDATA[<math><mrow><munder><mi>&Sigma;</mi><mi>j</mi></munder><msubsup><mi>x</mi><mi>ij</mi><mrow><mo>&prime;</mo><mo>&prime;</mo><mn>2</mn></mrow></msubsup><mo>+</mo><munder><mi>&Sigma;</mi><mi>j</mi></munder><msubsup><mi>y</mi><mi>ij</mi><mrow><mo>&prime;</mo><mo>&prime;</mo><mn>2</mn></mrow></msubsup><mo>=</mo><mn>1</mn><mo>;</mo></mrow></math>]]></maths>步骤3:对面部运动序列Ω中的每一帧形状作复数化处理,每个点的横坐标为实部,纵坐标为虚部,将2×M维的实值面部形状向量转换为M维复数向量ω<sub>i</sub>={s<sub>1</sub>,s<sub>2</sub>...s<sub>M</sub>},其中s<sub>ij</sub>=x<sub>ij</sub>+I×y<sub>ij</sub>,I为复数单位,I<sup>2</sup>=-1;步骤4:去掉复数表示中的冗余信息。利用各个形状的实虚部之和为零的特点(如步骤1),用特定矩阵左乘面部序列Ω,该矩阵Ω可以将向量<img file="FDA0000079647790000018.GIF" wi="380" he="131" />转变<img file="FDA0000079647790000019.GIF" wi="208" he="107" />利用各个面部形状均值为零的特点,可以使面部运动形状序列的最后一行归零,再去掉最后一行将复数表示的形状向量维数降为M-1,由此形成的复数空间称为“正则形状空间”(Norshape Space);步骤5:结合黎曼几何切空间映射,将复数表示的面部运动序列投影至运动流形的切空间,形成面部运动轨迹。经过上述步骤处理经过上述步骤得到的“正则形状空间”具有一条重要性质:正则形状空间切空间的水平子空间与原始形状空间同构,即正则形状空间切空间的水平子空间中的欧式距离与原始形状空间中的流形距离等价,可以通过向切空间投影得到反映面部运动的轨迹;(2)关于高斯过程隐变量模型面部运动流形学习,其步骤如下:ω=f(x)为一个实值函数,高斯隐变量模型利用高斯过程逼近这一函数,通过最大化后验概率确定变量x的值,该变量作为参数隐含于高斯过程中,故称为高斯过程隐变量模型。其中高斯过程指服从高斯分布的随机过程,即g(x)~N(m(x),δ<sup>2</sup>(x)),m(x)、δ<sup>2</sup>(x)分别为均值函数和协方差函数,本发明采用权值空间构造法(Weight-Space)构造高斯过程隐函数模型,即<img file="FDA0000079647790000021.GIF" wi="663" he="126" />w~N(0,I),则y为高斯分布。其中协方差函数采用径向基函数构造,径向基函数为:<img file="FDA0000079647790000022.GIF" wi="558" he="96" />具体步骤如下:步骤1:计算构造的高斯过程的均值及协方差函数,对于给定的面部运动序列s确定所构造的高斯过程的概率密度函数其中均值及协方差函数的计算方法为: 假设<maths num="0005"><![CDATA[<math><mrow><mi>s</mi><mo>=</mo><mi>g</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>J</mi></munderover><msub><mi>&omega;</mi><mi>j</mi></msub><msub><mi>&phi;</mi><mi>j</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>w</mi><mi>T</mi></msup><mi>&Phi;</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></math>]]></maths>为高斯分布,则m(x)=E(s)=E[w<sup>T</sup>Φ(x)]=0σ<sup>2</sup>(x)=E(s<sub>i</sub>s<sub>j</sub>)=E[(w<sup>T</sup>Φ(x<sub>i</sub>))(w<sup>T</sup>Φ(x<sub>j</sub>))]=Φ(x<sub>i</sub>)<sup>T</sup>Φ(x<sub>j</sub>)=K,其中K<sub>ij</sub>=k(x<sub>i</sub>,x<sub>j</sub>)当均值函数和协方差函数为已知时,高斯过程的概率密度函数可得到解析解。步骤2:采用尺度共轭梯度法(Scaled Conjugate Gradient)求解隐变量,进而得到对应面部运动轨迹的降维结果。尺度共轭梯度法的目标函数为:<maths num="0006"><![CDATA[<math><mrow><munder><mrow><mi>max</mi><mi>arg</mi></mrow><mi>x</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>S</mi><mo>|</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><munder><mrow><mi>max</mi><mi>arg</mi></mrow><mi>x</mi></munder><munderover><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>I</mi></munderover><mi>p</mi><mrow><mo>(</mo><msub><mi>s</mi><mi>i</mi></msub><mo>|</mo><mi>x</mi><mo>)</mo></mrow></mrow></math>]]></maths>即寻找使输出的形状序列S={s<sub>1</sub>,s<sub>2</sub>...s<sub>N</sub>}的联合概率最大。
地址 100191 北京市海淀区学院路37号