发明名称 基于数据流形的人脸自动识别方法
摘要 本发明提供了一种基于数据流形的人脸自动识别方法,它利用人脸数据本身的非线性结构信息,通过非监督或半监督的方法对未知的人脸样本进行识别。在没有任何人脸标签信息的情况下,通过提取人脸样本的谱特征进行非监督人脸识别;在只有部分人脸标签信息的情况下,通过线性近邻重建标签方法进行半监督人脸识别。
申请公布号 CN100416592C 申请公布日期 2008.09.03
申请号 CN200510111952.1 申请日期 2005.12.23
申请人 北京海鑫科金高科技股份有限公司 发明人 刘晓春;陆乃将;张长水
分类号 G06K9/00(2006.01) 主分类号 G06K9/00(2006.01)
代理机构 北京国林贸知识产权代理有限公司 代理人 刁玉生
主权项 1. 一种基于数据流形的人脸自动识别方法,包含:判断人脸样本是否具有标签;在没有任何人脸标签的情况下,通过人脸样本的谱特征进行非监督人脸识别;该人脸样本的谱特征的求得方法包括:对于所有的人脸样本,计算其两两之间的相似度;根据这些相似度,构造人脸样本的相似度矩阵;构造加权矩阵;建立加权后的相似度矩阵;计算特征值所对应的特征矢量;计算所有人脸样本中任意一个人脸样本的谱特征;在有人脸标签的情况下,用线性近邻重建标签方法进行半监督人脸识别;所述的线性近邻重建标签方法包括:将所有人脸样本收集起来,按照欧氏距离求取每一个样本的<img file="C2005101119520002C1.GIF" wi="51" he="53" />近邻;求取每个样本的邻域权重;根据近邻关系计算没有标签的人脸样本的标签,完成人脸识别;所述人脸样本计算其两两之间的相似度的方法如下:假设Ai,Aj是两副人脸图像,它们之间的相似度按下式计算:<maths num="0001"><![CDATA[<math><mrow><mi>S</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>e</mi><mfrac><msup><msub><mrow><mo>|</mo><mo>|</mo><mi>Ai</mi><mo>-</mo><mi>Aj</mi><mo>|</mo><mo>|</mo></mrow><mi>F</mi></msub><mn>2</mn></msup><mrow><mn>2</mn><msup><mi>&sigma;</mi><mn>2</mn></msup></mrow></mfrac></msup></mrow></math>]]></maths>其中||Ai-Aj||<sub>F</sub>表示矩阵Ai-Aj的Frobenius范数,而σ是一个需要由经验给定的参数,该参数通常选为<maths num="0002"><![CDATA[<math><mrow><munder><mi>max</mi><mi>ij</mi></munder><mo>|</mo><mo>|</mo><mi>Ai</mi><mo>-</mo><mi>Aj</mi><mo>|</mo><mo>|</mo><mo>-</mo><munder><mi>min</mi><mi>ij</mi></munder><mo>|</mo><mo>|</mo><mi>Ai</mi><mo>-</mo><mi>Aj</mi><mo>|</mo><mo>|</mo></mrow></math>]]></maths>的10%到20%;所述的相似度矩阵的公式表达为:<img file="C2005101119520002C4.GIF" wi="854" he="318" />所述的加权矩阵的公式表达为:<img file="C2005101119520003C1.GIF" wi="1132" he="369" />所述加权后的相似度矩阵的公式表达为A=WSW;所述的计算所有人脸样本中任意一个人脸样本的谱特征的方法如下:对所述的加权后的相似度矩阵A进行特征值分解,并取其最大的k个特征值对应的特征矢量,那么训练集中数据X<sub>k</sub>的第j个谱特征可定义为:<maths num="0003"><![CDATA[<math><mrow><msubsup><mi>F</mi><mi>j</mi><mi>k</mi></msubsup><mo>=</mo><msubsup><mi>w</mi><mi>k</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mrow><mo>(</mo><msqrt><msub><mi>&lambda;</mi><mi>j</mi></msub></msqrt><msup><mi>&alpha;</mi><mi>j</mi></msup><mo>)</mo></mrow><mi>k</mi></msub><mo>;</mo></mrow></math>]]></maths>其中w<sub>k</sub>表示加权矩阵w对角线上的第k个元素,而(λ<sub>j</sub>,α<sup>j</sup>)是矩阵A的第k个特征值-特征矢量对,而(g)<sub>k</sub>表示取向量的第k个元素;对于新来的测试样本可通过下式求其谱特征:<maths num="0004"><![CDATA[<math><mrow><msubsup><mi>F</mi><mi>y</mi><mi>k</mi></msubsup><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><mfrac><msup><mi>&alpha;</mi><mi>i</mi></msup><msqrt><msub><mi>&lambda;</mi><mi>i</mi></msub></msqrt></mfrac><msub><mi>w</mi><mi>i</mi></msub><mi>S</mi><mrow><mo>(</mo><mi>y</mi><mo>,</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>其中y为测试样本,S(y,x<sub>i</sub>)表示测试样本y与训练样本x<sub>i</sub>之间的相似度。
地址 100071北京市丰台区丰台路口139号西附楼204号