发明名称 人脸表情图像的分类及语义评判量化方法
摘要 本发明涉及在语义评判基础上对人脸表情图像分类及语义评判并进行量化的分析方法。本发明利用训练人脸表情图像样本集,提取表情特征形成标记图LG向量,将其投影到主成分PCA子空间中,利用这些降维后的LG向量学混合多维t-分布,作为该图像六种基本情感的语义评判,按照哪个表情所占的概率最大,从而把该图像判到该表情类中。解决了现有技术存在的不明确、自动人脸表情识别困难,难以克服的奇异性等缺陷。本发明是一种极度柔韧和功能强大的基于统计的建模工具,提供了一个更鲁棒方法,避免了对观测样本所属分量的后验概率的极端估计,训练样本不需要标记,不需要任何后处理,对野值不太敏感,避免了这种人工评判。
申请公布号 CN100447808C 申请公布日期 2008.12.31
申请号 CN200710019296.1 申请日期 2007.01.12
申请人 郑文明 发明人 郑文明;王海贤;周晓彦
分类号 G06K9/00(2006.01) 主分类号 G06K9/00(2006.01)
代理机构 南京中新达专利代理有限公司 代理人 孙鸥
主权项 1.人脸表情图像的分类及语义评判量化方法,其步骤如下:(1)利用训练人脸表情图像样本集,提取表情特征形成标记图LG向量;(2)将这些LG向量投影到主成分PCA子空间中,丢弃那些较小的主成分;(3)利用这些降维后的LG向量学习混合多元t-分布,设x<sub>1</sub>,…,x<sub>n</sub>为样本量为n的p维LG向量,它们独立地抽自一个g-分量的混合多元t-分布:<maths num="0001"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><mi>&Theta;</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></munderover><msub><mi>&pi;</mi><mi>j</mi></msub><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>&theta;</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>其中,分量概率密度函数f<sub>j</sub>(x<sub>i</sub>;θ<sub>j</sub>)表示给定x<sub>i</sub>来自第j个分量时x<sub>i</sub>的条件概率密度函数,θ<sub>j</sub>为参数,混合比例π<sub>j</sub>非负且满足<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></msubsup><msub><mi>&pi;</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo></mrow></math>]]></maths>有三组参数:混合比例π<sub>j</sub>,向量θ<sub>j</sub>,分量数目g,模型中参数集Θ=(π<sub>1</sub>,…π<sub>g-1</sub>,θ<sub>1</sub>,…,θ<sub>g</sub>),参数<maths num="0003"><![CDATA[<math><mrow><msub><mi>&pi;</mi><mi>g</mi></msub><mo>=</mo><mn>1</mn><mo>-</mo><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>g</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>&pi;</mi><mi>j</mi></msub><mo>,</mo></mrow></math>]]></maths>在表情研究中,令g=6为基本表情的类别数,f<sub>j</sub>(x<sub>i</sub>;θ<sub>j</sub>)为p-维t-分布:<maths num="0004"><![CDATA[<math><mrow><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>&theta;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>,</mo><msub><mi>&Sigma;</mi><mi>j</mi></msub><mo>,</mo><msub><mi>&gamma;</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mo>=</mo><mfrac><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>&gamma;</mi><mi>j</mi></msub><mo>+</mo><mi>p</mi></mrow><mn>2</mn></mfrac><mo>)</mo></mrow><msup><mrow><mo>|</mo><msub><mi>&Sigma;</mi><mi>j</mi></msub><mo>|</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac></mrow></msup></mrow><mrow><msup><mrow><mo>(</mo><mi>&Gamma;</mi><mrow><mo>(</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>p</mi></msup><mi>&Gamma;</mi><mrow><mo>(</mo><mfrac><msub><mi>&gamma;</mi><mi>j</mi></msub><mn>2</mn></mfrac><mo>)</mo></mrow><msubsup><mi>&gamma;</mi><mi>j</mi><mfrac><mi>p</mi><mn>2</mn></mfrac></msubsup></mrow></mfrac><msup><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mfrac><mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>&Sigma;</mi><mi>j</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><msub><mi>&gamma;</mi><mi>j</mi></msub></mfrac><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mrow><mo>(</mo><msub><mi>&gamma;</mi><mi>j</mi></msub><mo>+</mo><mi>p</mi><mo>)</mo></mrow><mn>2</mn></mfrac></mrow></msup></mrow></math>]]></maths>其中,θ<sub>j</sub>=(μ<sub>j</sub>,∑<sub>j</sub>,γ<sub>j</sub>)<sup>T</sup>,∑<sub>j</sub>是一正定矩阵,γ<sub>j</sub>是自由度,Gamma函数<maths num="0006"><![CDATA[<math><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mo>&infin;</mo></msubsup><msup><mi>e</mi><mrow><mo>-</mo><mi>x</mi></mrow></msup><msup><mi>x</mi><mrow><mi>s</mi><mo>-</mo><mn>1</mn></mrow></msup><mi>dx</mi><mo>,</mo></mrow></math>]]></maths>其中s的取值为正数,利用期望最大化算法,迭代计算模型参数Θ的极大似然估计,即具体地说,在E-步,利用目前Θ的估计<img file="C2007100192960002C7.GIF" wi="105" he="56" />计算x<sub>i</sub>来自第j个分量地后验概率<maths num="0007"><![CDATA[<math><mrow><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mover><mi>&pi;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></msubsup><msubsup><mover><mi>&pi;</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>及条件概率<maths num="0008"><![CDATA[<math><mrow><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><mi>p</mi></mrow><mrow><msubsup><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>j</mi><msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>在M-步,参数π<sub>j</sub>,μ<sub>j</sub>,∑<sub>j</sub>分别被更新为:<maths num="0009"><![CDATA[<math><mrow><msubsup><mover><mi>&pi;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>x</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></mfrac></mrow></math>]]></maths><maths num="0011"><![CDATA[<math><mrow><msubsup><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>&omega;</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></mfrac></mrow></math>]]></maths>自由度的更新估计<img file="C2007100192960003C5.GIF" wi="98" he="55" />是下面非线性方程的解:<img file="C2007100192960003C6.GIF" wi="1283" he="151" /><maths num="0012"><![CDATA[<math><mrow><mo>-</mo><mi>log</mi><mrow><mo>(</mo><mfrac><mrow><msubsup><mi>&gamma;</mi><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><mi>p</mi></mrow><mn>2</mn></mfrac><mo>)</mo></mrow><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(4)对于一个测试人脸表情图像t,用它来自每个分量的后验概率<maths num="0013"><![CDATA[<math><mrow><msub><mover><mi>z</mi><mo>^</mo></mover><mi>j</mi></msub><mo>=</mo><mfrac><mrow><msub><mover><mi>&pi;</mi><mo>^</mo></mover><mi>j</mi></msub><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>;</mo><msub><mover><mi>&mu;</mi><mo>^</mo></mover><mi>j</mi></msub><mo>,</mo><msub><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>j</mi></msub><mo>,</mo><msub><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></msubsup><msub><mover><mi>&pi;</mi><mo>^</mo></mover><mi>l</mi></msub><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>;</mo><msub><mover><mi>&mu;</mi><mo>^</mo></mover><mi>l</mi></msub><mo>,</mo><msub><mover><mi>&Sigma;</mi><mo>^</mo></mover><mi>l</mi></msub><mo>,</mo><msub><mover><mi>&gamma;</mi><mo>^</mo></mover><mi>l</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>作为该图像六种基本情感的语义评判,其中,j=1,…,6,参数<img file="C2007100192960003C9.GIF" wi="262" he="71" />为EM学习算法中迭代收敛后的值,且在语义评判中,按照哪个表情所占的概率最大,从而把该图像判到该表情类中。
地址 210096江苏省南京市四牌楼2号东南大学