人脸表情图像的分类及语义评判量化方法,申请号CN200710019296.1-传众专利搜索

发明名称	人脸表情图像的分类及语义评判量化方法
摘要	本发明涉及在语义评判基础上对人脸表情图像分类及语义评判并进行量化的分析方法。本发明利用训练人脸表情图像样本集，提取表情特征形成标记图LG向量，将其投影到主成分PCA子空间中，利用这些降维后的LG向量学混合多维t-分布，作为该图像六种基本情感的语义评判，按照哪个表情所占的概率最大，从而把该图像判到该表情类中。解决了现有技术存在的不明确、自动人脸表情识别困难，难以克服的奇异性等缺陷。本发明是一种极度柔韧和功能强大的基于统计的建模工具，提供了一个更鲁棒方法，避免了对观测样本所属分量的后验概率的极端估计，训练样本不需要标记，不需要任何后处理，对野值不太敏感，避免了这种人工评判。
申请公布号	CN100447808C	申请公布日期	2008.12.31
申请号	CN200710019296.1	申请日期	2007.01.12
申请人	郑文明	发明人	郑文明;王海贤;周晓彦
分类号	G06K9/00(2006.01)	主分类号	G06K9/00(2006.01)
代理机构	南京中新达专利代理有限公司	代理人	孙鸥
主权项	1.人脸表情图像的分类及语义评判量化方法，其步骤如下：(1)利用训练人脸表情图像样本集，提取表情特征形成标记图LG向量；(2)将这些LG向量投影到主成分PCA子空间中，丢弃那些较小的主成分；(3)利用这些降维后的LG向量学习混合多元t-分布，设x<sub>1</sub>，…，x<sub>n</sub>为样本量为n的p维LG向量，它们独立地抽自一个g-分量的混合多元t-分布：<maths num="0001"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><mi>Θ</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></munderover><msub><mi>π</mi><mi>j</mi></msub><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>θ</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>其中，分量概率密度函数f<sub>j</sub>(x<sub>i</sub>；θ<sub>j</sub>)表示给定x<sub>i</sub>来自第j个分量时x<sub>i</sub>的条件概率密度函数，θ<sub>j</sub>为参数，混合比例π<sub>j</sub>非负且满足<maths num="0002"><![CDATA[<math><mrow><msubsup><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></msubsup><msub><mi>π</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn><mo>,</mo></mrow></math>]]></maths>有三组参数：混合比例π<sub>j</sub>，向量θ<sub>j</sub>，分量数目g，模型中参数集Θ＝(π<sub>1</sub>，…π<sub>g-1</sub>，θ<sub>1</sub>，…，θ<sub>g</sub>)，参数<maths num="0003"><![CDATA[<math><mrow><msub><mi>π</mi><mi>g</mi></msub><mo>=</mo><mn>1</mn><mo>-</mo><msubsup><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>g</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>π</mi><mi>j</mi></msub><mo>,</mo></mrow></math>]]></maths>在表情研究中，令g＝6为基本表情的类别数，f<sub>j</sub>(x<sub>i</sub>；θ<sub>j</sub>)为p-维t-分布：<maths num="0004"><![CDATA[<math><mrow><msub><mi>f</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>θ</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msub><mi>μ</mi><mi>j</mi></msub><mo>,</mo><msub><mi>Σ</mi><mi>j</mi></msub><mo>,</mo><msub><mi>γ</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mo>=</mo><mfrac><mrow><mi>Γ</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>γ</mi><mi>j</mi></msub><mo>+</mo><mi>p</mi></mrow><mn>2</mn></mfrac><mo>)</mo></mrow><msup><mrow><mo>\|</mo><msub><mi>Σ</mi><mi>j</mi></msub><mo>\|</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac></mrow></msup></mrow><mrow><msup><mrow><mo>(</mo><mi>Γ</mi><mrow><mo>(</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>p</mi></msup><mi>Γ</mi><mrow><mo>(</mo><mfrac><msub><mi>γ</mi><mi>j</mi></msub><mn>2</mn></mfrac><mo>)</mo></mrow><msubsup><mi>γ</mi><mi>j</mi><mfrac><mi>p</mi><mn>2</mn></mfrac></msubsup></mrow></mfrac><msup><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mfrac><mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>μ</mi><mi>j</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mi>Σ</mi><mi>j</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>μ</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow><msub><mi>γ</mi><mi>j</mi></msub></mfrac><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mrow><mo>(</mo><msub><mi>γ</mi><mi>j</mi></msub><mo>+</mo><mi>p</mi><mo>)</mo></mrow><mn>2</mn></mfrac></mrow></msup></mrow></math>]]></maths>其中，θ<sub>j</sub>＝(μ<sub>j</sub>，∑<sub>j</sub>，γ<sub>j</sub>)<sup>T</sup>，∑<sub>j</sub>是一正定矩阵，γ<sub>j</sub>是自由度，Gamma函数<maths num="0006"><![CDATA[<math><mrow><mi>Γ</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mo>∞</mo></msubsup><msup><mi>e</mi><mrow><mo>-</mo><mi>x</mi></mrow></msup><msup><mi>x</mi><mrow><mi>s</mi><mo>-</mo><mn>1</mn></mrow></msup><mi>dx</mi><mo>,</mo></mrow></math>]]></maths>其中s的取值为正数，利用期望最大化算法，迭代计算模型参数Θ的极大似然估计，即具体地说，在E-步，利用目前Θ的估计<img file="C2007100192960002C7.GIF" wi="105" he="56" />计算x<sub>i</sub>来自第j个分量地后验概率<maths num="0007"><![CDATA[<math><mrow><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mover><mi>π</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>Σ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>γ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mi>g</mi></msubsup><msubsup><mover><mi>π</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>;</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>Σ</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>,</mo><msubsup><mover><mi>γ</mi><mo>^</mo></mover><mi>l</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>及条件概率<maths num="0008"><![CDATA[<math><mrow><msubsup><mover><mi>ω</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mover><mi>γ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><mi>p</mi></mrow><mrow><msubsup><mover><mi>γ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mi>T</mi></msup><msubsup><mover><mi>Σ</mi><mo>^</mo></mover><mi>j</mi><msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>在M-步，参数π<sub>j</sub>，μ<sub>j</sub>，∑<sub>j</sub>分别被更新为：<maths num="0009"><![CDATA[<math><mrow><msubsup><mover><mi>π</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>ω</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msub><mi>x</mi><mi>i</mi></msub></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>ω</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></mfrac></mrow></math>]]></maths><maths num="0011"><![CDATA[<math><mrow><msubsup><mover><mi>Σ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><mrow><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>ω</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>)</mo></mrow><mi>T</mi></msup></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msubsup><mover><mi>z</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><msubsup><mover><mi>ω</mi><mo>^</mo></mover><mi>ij</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup></mrow></mfrac></mrow></math>]]></maths>自由度的更新估计<img file="C2007100192960003C5.GIF" wi="98" he="55" />是下面非线性方程的解：<img file="C2007100192960003C6.GIF" wi="1283" he="151" /><maths num="0012"><![CDATA[<math><mrow><mo>-</mo><mi>log</mi><mrow><mo>(</mo><mfrac><mrow><msubsup><mi>γ</mi><mi>j</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></msubsup><mo>+</mo><mi>p</mi></mrow><mn>2</mn></mfrac><mo>)</mo></mrow><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(4)对于一个测试人脸表情图像t，用它来自每个分量的后验概率<maths num="0013"><![CDATA[<math><mrow><msub><mover><mi>z</mi><mo>^</mo></mover><mi>j</mi></msub><mo>=</mo><mfrac><mrow><msub><mover><mi>π</mi><mo>^</mo></mover><mi>j</mi></msub><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>;</mo><msub><mover><mi>μ</mi><mo>^</mo></mover><mi>j</mi></msub><mo>,</mo><msub><mover><mi>Σ</mi><mo>^</mo></mover><mi>j</mi></msub><mo>,</mo><msub><mover><mi>γ</mi><mo>^</mo></mover><mi>j</mi></msub><mo>)</mo></mrow></mrow><mrow><msubsup><mi>Σ</mi><mrow><mi>l</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></msubsup><msub><mover><mi>π</mi><mo>^</mo></mover><mi>l</mi></msub><msub><mi>t</mi><mi>p</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>;</mo><msub><mover><mi>μ</mi><mo>^</mo></mover><mi>l</mi></msub><mo>,</mo><msub><mover><mi>Σ</mi><mo>^</mo></mover><mi>l</mi></msub><mo>,</mo><msub><mover><mi>γ</mi><mo>^</mo></mover><mi>l</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>作为该图像六种基本情感的语义评判，其中，j＝1，…，6，参数<img file="C2007100192960003C9.GIF" wi="262" he="71" />为EM学习算法中迭代收敛后的值，且在语义评判中，按照哪个表情所占的概率最大，从而把该图像判到该表情类中。
地址	210096江苏省南京市四牌楼2号东南大学