发明名称 一种带局域限制的矩阵概念分解方法
摘要 本发明公开了一种带局域限制的矩阵概念分解方法,包括:(1)构建样本特征矩阵;(2)迭代输出基矩阵和系数矩阵;(3)求取样本特征矩阵的基和低维表示。本发明通过在目标函数中加入局域限制的正则项,使得分解得到的基尽可能接近更多的原始数据,所得数据表示可以同时满足稀疏性和局域限制;且通过降维去掉了高维数据中的冗余信息,提取出了能准确表示数据语义结构的低维表示,使得对于高维数据的聚类分析变得简单而有效,并具有良好的可解释性。
申请公布号 CN102779162B 申请公布日期 2014.09.17
申请号 CN201210200313.2 申请日期 2012.06.14
申请人 浙江大学 发明人 刘海风;杨根茂;杨政;吴朝晖
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 一种用于人脸图像聚类分析的带局域限制的矩阵概念分解方法,包括如下步骤:(1)获取关于人脸图像的样本集合,进而构建该样本集合的样本特征矩阵;所述的样本特征矩阵为m×n维矩阵,m为特征个数,n为样本个数,且m和n均为大于1的自然数,样本特征矩阵中的任一元素值为对应样本对应特征的特征值;(2)根据所述的样本特征矩阵,通过带局域限制的迭代算法求解出基矩阵和系数矩阵,带局域限制的迭代算法基于以下迭代方程组:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>w</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mi>t</mi></msubsup><mo>=</mo><msubsup><mi>w</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mfrac><mrow><msubsup><mi>r</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>+</mo><msqrt><msup><mrow><mo>(</mo><msubsup><mi>r</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mn>2</mn></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msubsup><mi>p</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msubsup><mi>h</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></msqrt></mrow><mrow><mn>2</mn><msubsup><mi>p</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></mfrac></mrow>]]></math><img file="FDA0000533173490000011.GIF" wi="1074" he="243" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>v</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>t</mi></msubsup><mo>=</mo><msubsup><mi>v</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mfrac><mrow><msubsup><mi>s</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>+</mo><msqrt><msup><mrow><mo>(</mo><msubsup><mi>s</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mn>4</mn><msubsup><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msubsup><mi>z</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></msqrt></mrow><mrow><mn>2</mn><msubsup><mi>q</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></mfrac></mrow>]]></math><img file="FDA0000533173490000012.GIF" wi="1070" he="243" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msup><mi>R</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>=</mo><mi>U</mi><msup><mrow><mo>(</mo><msup><mi>V</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><mo>+</mo><mi>&lambda;</mi><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msup><mi>X</mi><mi>T</mi></msup><msub><mi>X</mi><mi>j</mi></msub><msup><mi>I</mi><mi>T</mi></msup><msubsup><mi>D</mi><mi>j</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></mrow>]]></math><img file="FDA0000533173490000013.GIF" wi="971" he="164" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mi>P</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>=</mo><msup><mi>U</mi><mo>+</mo></msup><msup><mi>W</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mi>V</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mrow><mo>(</mo><msup><mi>V</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><mo>+</mo><mi>&lambda;</mi><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msup><mi>U</mi><mo>+</mo></msup><msup><mi>W</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msubsup><mi>D</mi><mi>j</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></mrow>]]></math><img file="FDA0000533173490000014.GIF" wi="1280" he="173" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msup><mi>H</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>=</mo><msup><mi>U</mi><mo>-</mo></msup><msup><mi>W</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mi>V</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mrow><mo>(</mo><msup><mi>V</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mi>T</mi></msup><mo>+</mo><mi>&lambda;</mi><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msup><mi>U</mi><mo>-</mo></msup><msup><mi>W</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><msubsup><mi>D</mi><mi>j</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msubsup></mrow>]]></math><img file="FDA0000533173490000015.GIF" wi="1289" he="175" /></maths>S<sup>t‑1</sup>=2(λ+1)(W<sup>t‑1</sup>)<sup>T</sup>U‑λ(A+B<sup>t‑1</sup>)Q<sup>t‑1</sup>=2(W<sup>t‑1</sup>)<sup>T</sup>U<sup>+</sup>W<sup>t‑1</sup>V<sup>t‑1</sup>Z<sup>t‑1</sup>=2(W<sup>t‑1</sup>)<sup>T</sup>U<sup>‑</sup>W<sup>t‑1</sup>V<sup>t‑1</sup><maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msubsup><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>+</mo></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>,</mo></mtd><mtd><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>&GreaterEqual;</mo><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>&lt;</mo><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000533173490000016.GIF" wi="600" he="168" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo></msubsup><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mo>|</mo><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>|</mo><mo>,</mo></mtd><mtd><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>&lt;</mo><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><msub><mi>u</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></msub><mo>&GreaterEqual;</mo><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000533173490000017.GIF" wi="645" he="183" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msup><mi>O</mi><mi>t</mi></msup><mo>=</mo><msup><mrow><mo>|</mo><mo>|</mo><mi>X</mi><mo>-</mo><mi>X</mi><msup><mi>W</mi><mi>t</mi></msup><msup><mi>V</mi><mi>t</mi></msup><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>+</mo><mi>&lambda;</mi><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>l</mi></munderover><mo>|</mo><msubsup><mi>v</mi><mrow><mo>(</mo><mi>k</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mi>t</mi></msubsup><mo>|</mo><msup><mrow><mo>|</mo><mo>|</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msubsup><mi>w</mi><mrow><mo>(</mo><mi>j</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mi>t</mi></msubsup><msub><mi>X</mi><mi>j</mi></msub><mo>-</mo><msub><mi>X</mi><mi>i</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup></mrow>]]></math><img file="FDA0000533173490000021.GIF" wi="1430" he="253" /></maths><maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><mfrac><mrow><msup><mi>O</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup><mo>-</mo><msup><mi>O</mi><mi>t</mi></msup></mrow><msup><mi>O</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow></msup></mfrac><mo>&lt;</mo><mi>&rho;</mi></mrow>]]></math><img file="FDA00005331734900000217.GIF" wi="385" he="145" /></maths>其中:X为样本特征矩阵,W为n×l维的基矩阵,V为l×n维的系数矩阵,l为聚类个数且为给定值;W<sup>t</sup>和V<sup>t</sup>分别为t次迭代后的基矩阵和系数矩阵,<img file="FDA0000533173490000022.GIF" wi="134" he="96" />为W<sup>t</sup>中第j行第k列的元素值,<img file="FDA0000533173490000023.GIF" wi="127" he="96" />为V<sup>t</sup>中第k行第j列的元素值,<img file="FDA0000533173490000024.GIF" wi="131" he="96" />为V<sup>t</sup>中第k行第i列的元素值;W<sup>t‑1</sup>和V<sup>t‑1</sup>分别为t‑1次迭代后的基矩阵和系数矩阵,<img file="FDA0000533173490000025.GIF" wi="149" he="96" />为W<sup>t‑1</sup>中第j行第k列的元素值,<img file="FDA0000533173490000026.GIF" wi="129" he="96" />为V<sup>t‑1</sup>中第k行第j列的元素值;R<sup>t‑1</sup>、P<sup>t‑1</sup>和H<sup>t‑1</sup>均为n×l维的矩阵,<img file="FDA0000533173490000027.GIF" wi="123" he="96" />为R<sup>t‑1</sup>中第j行第k列的元素值,<img file="FDA0000533173490000028.GIF" wi="128" he="96" />为P<sup>t‑1</sup>中第j行第k列的元素值,<img file="FDA0000533173490000029.GIF" wi="126" he="96" />为H<sup>t‑1</sup>中第j行第k列的元素值;S<sup>t‑1</sup>、Q<sup>t‑1</sup>和Z<sup>t‑1</sup>均为l×n维的矩阵,<img file="FDA00005331734900000210.GIF" wi="120" he="96" />为S<sup>t‑1</sup>中第k行第j列的元素值,<img file="FDA00005331734900000211.GIF" wi="132" he="96" />为Q<sup>t‑1</sup>中第k行第j列的元素值,<img file="FDA00005331734900000212.GIF" wi="124" he="96" />为Z<sup>t‑1</sup>中第k行第j列的元素值;U为n×n维的矩阵且U=X<sup>T</sup>X,u<sub>(i,j)</sub>为U中第i行第j列的元素值;I为元素值均为1的l维向量;X<sub>j</sub>为X中第j列向量;<img file="FDA00005331734900000213.GIF" wi="524" he="102" /><img file="FDA00005331734900000214.GIF" wi="123" he="96" />为V<sup>t‑1</sup>中第j列向量;A和B<sup>t‑1</sup>均为l×n维的矩阵,A=(a,…,a)<sup>T</sup>,B<sup>t‑1</sup>=(b<sup>t‑1</sup>,…,b<sup>t‑1</sup>),a=diag(U),b<sup>t‑1</sup>=diag[(W<sup>t‑1</sup>)<sup>T</sup>UW<sup>t‑1</sup>];U<sup>+</sup>和U<sup>‑</sup>均为n×n维的矩阵,<img file="FDA00005331734900000215.GIF" wi="122" he="93" />为U<sup>+</sup>中第i行第j列的元素值,<img file="FDA00005331734900000216.GIF" wi="116" he="84" />为U<sup>‑</sup>中第i行第j列的元素值;λ为迭代运算系数且为实际经验值,ρ为收敛阈值且为实际经验值;X<sub>i</sub>为X中第i列向量;i、j和k均为自然数且1≤i≤n,1≤j≤n,1≤k≤l;(3)使所述的系数矩阵作为样本特征矩阵的低维表示,并根据所述的基矩阵计算出样本特征矩阵的基,以供聚类分析。
地址 310027 浙江省杭州市西湖区浙大路38号