发明名称 基于最优维数标度切判据的人脸识别方法
摘要 本发明公开了一种基于最优维数标度切判据的人脸识别方法,主要解决现有方法在对特征进行降维时无法自动确定最优维数而导致的识别率低及计算量大的问题。其步骤包括:对已知类别的图像和待测试图像进行预处理,得到训练样本集和测试样本集;分别构造训练集的局部类间和局部类内不相似性矩阵,及总的局部不相似性矩阵;构造基于最优维数局部标度切的加权差分矩阵,对该矩阵进行特征分解得到最优维数以及最优投影矩阵;分别将训练集和测试集投影到低维空间,得到新的训练集和测试集;将新的训练集和测试集输入K近邻分类器进行分类,得到测试图像的类别。本发明具有自动选择最优维数的优点,并能得到较高的识别率,可用于公共安全、信息安全领域。
申请公布号 CN102208020A 申请公布日期 2011.10.05
申请号 CN201110199501.3 申请日期 2011.07.16
申请人 西安电子科技大学 发明人 张向荣;焦李成;周楠;周斯斯;贺予迪;侯彪;马文萍;李阳阳
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱红星
主权项 1.一种基于最优维数局部标度切判据的人脸识别方法,包括如下步骤:(1)分别对已知类别标签的训练图像和待测试图像进行预处理,得到预处理后的训练样本集<img file="FDA0000076268480000011.GIF" wi="331" he="64" />以及测试样本集<img file="FDA0000076268480000012.GIF" wi="353" he="83" />训练样本集对应的类别标签集用<img file="FDA0000076268480000013.GIF" wi="177" he="64" />表示,其中,x<sub>i</sub>和x′<sub>j</sub>分别表示训练样本集的第i个训练样本和测试样本集的第j个测试样本,每个样本用一个行向量表示,l<sub>i</sub>是第i个训练样本所属的类别标号,N和M分别是训练样本总个数和测试样本总个数,D表示所有样本的原始特征维数,R表示实数域;(2)构造训练样本集X的局部类间不相似性矩阵<img file="FDA0000076268480000014.GIF" wi="36" he="54" />和局部类内不相似性矩阵<img file="FDA0000076268480000015.GIF" wi="63" he="51" /><maths num="0001"><![CDATA[<math><mrow><mover><mi>C</mi><mo>~</mo></mover><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>h</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>p</mi></msub></munderover><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>N</mi><mi>hi</mi><mi>b</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>h</mi></msub><mo>-</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>h</mi></msub><mo>-</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><mover><mi>A</mi><mo>~</mo></mover><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>p</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>h</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>n</mi><mi>p</mi></msub></munderover><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>N</mi><mi>hi</mi><mi>w</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>h</mi></msub><mo>-</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>h</mi></msub><mo>-</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>其中,c表示训练样本的类别数,即原始图像的类别数,n<sub>p</sub>表示训练样本集中第p类的训练样本个数,N表示训练样本总个数,x<sub>h</sub>表示第p类的第h个训练样本,x<sub>i</sub>表示训练样本集中的第i个训练样本,T表示矩阵的转置,<img file="FDA0000076268480000018.GIF" wi="63" he="57" />为调节类间近邻数的系数,<img file="FDA0000076268480000019.GIF" wi="672" he="183" /><img file="FDA00000762684800000110.GIF" wi="63" he="51" />为调节类内近邻数的系数,<img file="FDA00000762684800000111.GIF" wi="679" he="184" />式中,q<sub>b</sub>表示类间近邻数,即从第p类以外的训练样本中选出的与x<sub>h</sub>距离最近的近邻样本个数,N<sub>b</sub>(x<sub>h</sub>)定义为训练样本x<sub>h</sub>的类间q<sub>b</sub>近邻域,下标b均表示类间,q<sub>w</sub>表示类内近邻数,即从第p类训练样本中选出的与x<sub>h</sub>距离最近的近邻样本个数,N<sub>w</sub>(x<sub>h</sub>)定义为训练样本x<sub>h</sub>的类内q<sub>w</sub>近邻域,下标w均表示类内;(3)对训练样本集的局部类间不相似性矩阵<img file="FDA0000076268480000021.GIF" wi="36" he="54" />和局部类内不相似性矩阵<img file="FDA0000076268480000022.GIF" wi="39" he="51" />进行求和,得到训练样本集的总的局部不相似性矩阵:<img file="FDA0000076268480000023.GIF" wi="225" he="57" />(4)根据训练样本集的局部类间不相似性矩阵<img file="FDA0000076268480000024.GIF" wi="36" he="54" />和总的局部不相似性矩阵<img file="FDA0000076268480000025.GIF" wi="59" he="54" />得到基于最优维数标度切的加权差分矩阵<img file="FDA0000076268480000026.GIF" wi="297" he="124" />其中,tr表示对矩阵求迹,<img file="FDA0000076268480000027.GIF" wi="78" he="124" />表示加权系数;(5)对基于最优维数标度切的加权差分矩阵S进行特征分解得到特征值以及对应的特征向量,取前d个最大特征值所对应的特征向量v<sub>1</sub>,v<sub>2</sub>,Λv<sub>d</sub>,构成最优投影矩阵V=[v<sub>1</sub>,v<sub>2</sub>,Λv<sub>d</sub>]∈R<sup>D×d</sup>,其中,d的值等于矩阵S的正的特征值数,即最优特征维数,D表示样本的原始特征维数,R表示实数域;(6)分别将训练样本集<img file="FDA0000076268480000028.GIF" wi="306" he="64" />和测试样本集<img file="FDA0000076268480000029.GIF" wi="328" he="83" />投影到由最优投影矩阵V所张成的低维空间,得到投影后的新的训练样本集<img file="FDA00000762684800000210.GIF" wi="323" he="68" />和新的测试样本集<img file="FDA00000762684800000211.GIF" wi="374" he="86" />其中,y<sub>i</sub>=&lt;x<sub>i</sub>·V&gt;为第i个训练样本的新的特征向量,x<sub>i</sub>为原训练样本集的第i个训练样本,y′<sub>j</sub>=&lt;x′<sub>j</sub>·V&gt;为第j个测试样本的新的特征向量,x′<sub>j</sub>为原测试样本集的第j个测试样本,N和M分别表示训练样本和测试样本的总个数,d表示新的样本集的特征维数,R表示实数域;(7)将新的训练样本集<img file="FDA00000762684800000212.GIF" wi="312" he="66" />和训练样本集的类别标签集<img file="FDA00000762684800000213.GIF" wi="203" he="64" />以及新的测试样本集<img file="FDA00000762684800000214.GIF" wi="356" he="88" />输入到K近邻分类器进行分类,得到测试图像的识别结果<img file="FDA00000762684800000215.GIF" wi="133" he="83" />其中,l′<sub>j</sub>表示第j个测试图像所属的类别标号。
地址 710071 陕西省西安市太白南路2号