发明名称 一种基于稀疏和低秩表示图的高光谱数据降维方法
摘要 一种基于稀疏和低秩表示图的高光谱数据降维方法,通过L<sub>1</sub>范数获取稀疏表示特性,低秩表示的具有保持全局数据结构的特征,本方法通过核范数保持图的低秩特性。本方法包括如下技术内容,1)从原始的高光谱数据中选取一定量的数据用作训练样本。2)对所选的训练样本进行稀疏和低秩表示图的构造。3)通过最优化准则,寻求最优的投影矩阵,使在投影后的低维流形空间里保持2中所构造的图的特性。在原始空间中学到的样本点间稀疏和低秩表示的特性,通过寻求一个变换投影矩阵,把数据投影到低维流形空间,同样也保持样本点间稀疏和低秩表示的特性。
申请公布号 CN105574548A 申请公布日期 2016.05.11
申请号 CN201510977094.2 申请日期 2015.12.23
申请人 北京化工大学 发明人 李伟;刘佳彬
分类号 G06K9/62(2006.01)I;G06T3/00(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 沈波
主权项 一种基于稀疏和低秩表示图的高光谱数据降维方法,其特征在于:本方法的具体步骤如下,步骤1、将高光谱数据输入计算机,并对数据进行归一化处理;步骤2、从归一化的高光谱图像中每个类别选取一定数量的样本点用于做训练样本;高光谱数据的原始维数为N,每类训练样本的数目根据原始图像的规模和具体应用而定;步骤3、对所选的训练样本进行稀疏和低秩表示图的构造;对于一个高光谱的数据,训练样本集为<img file="FDA0000887297190000011.GIF" wi="365" he="78" />N表示原始数据的维数,M表示所有训练样本点的数目;用C表示高光谱图像总类别的数目,m<sub>l</sub>表示属于l类的所有样本点的数目,故有<img file="FDA0000887297190000012.GIF" wi="262" he="77" />在SGDA中,对于任意一个像素X<sub>i</sub>∈X,其稀疏表示的系数向量通过求解L<sub>1</sub>范数最优化求取,即<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>argmin</mi><msub><mi>W</mi><mi>i</mi></msub></msub><mo>|</mo><mo>|</mo><msub><mi>W</mi><mi>i</mi></msub><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000887297190000013.GIF" wi="1021" he="79" /></maths>s.t.XW<sub>i</sub>=X<sub>i</sub>且w<sub>ii</sub>=0上式中,W<sub>i</sub>=[w<sub>i1</sub>,w<sub>i2</sub>,…,w<sub>iM</sub>]是一个M×1的向量,是其余属于X样本点对像素点X<sub>i</sub>的表示系数组成的向量;‖·‖<sub>1</sub>表示矩阵的L<sub>1</sub>范数,是矩阵各个元素的绝对值相加之和,用来求取稀疏解;进一步地,对于所有的像素点,写成矩阵的形式,有argmin<sub>W</sub>‖W‖<sub>1</sub>       (2)s.t.XW=X且diag(W)=0上式中,W=[w<sub>1</sub>,w<sub>2</sub>,…,w<sub>M</sub>]是一个M×M的矩阵,该矩阵的每个列向量W<sub>i</sub>是其余样本点对第i个点的稀疏表示系数;矩阵W表示的是在矩阵稀疏约束的条件下,除自身点以外其他样本点对该点的线性表示,反映了样本点之间的数据结构;然而稀疏表示的不足在于只能找出稀疏样本点,缺乏全局约束,因此在低维流形空间中丧失原有数据的全局特性;针对于步骤1中选取的训练样本,稀疏和低秩表示图的构造方法如下:argmin<sub>W</sub>‖W‖<sub>1</sub>+λ‖W‖<sub>*</sub>      (3)s.t.XW=X且diag(W)=0上式中‖·‖<sub>1</sub>表示矩阵的L<sub>1</sub>范数,是矩阵各个元素的绝对值相加之和,用于求取稀疏表示解;‖·‖<sub>*</sub>是矩阵的核范数,是矩阵奇异值之和,用于刻画图的低秩约束特性;W是一个M×M的矩阵,该矩阵的每个列向量W<sub>i</sub>是一个M×1的向量,是其余样本点对第i个点的稀疏和低秩表示的系数;上式等价于:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>argmin</mi><mi>W</mi></msub><mo>|</mo><mo>|</mo><mi>X</mi><mo>-</mo><mi>X</mi><mi>W</mi><mo>|</mo><msubsup><mo>|</mo><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&beta;</mi><mo>|</mo><mo>|</mo><mi>W</mi><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mi>&lambda;</mi><mo>|</mo><mo>|</mo><mi>W</mi><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000887297190000021.GIF" wi="1189" he="78" /></maths>s.t.diag(W)=0<img file="FDA0000887297190000022.GIF" wi="95" he="70" />表示矩阵的F范数,β和λ都是正则化系数,β和λ的大小控制(4)式子中三者的平衡关系;对于本文提出的SLGDA,用于有监督的降维算法,增加数据类别标签信息,针对于相同类别训练样本的稀疏和低秩表示,有:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>argmin</mi><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup></msub><mo>|</mo><mo>|</mo><msup><mi>X</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>-</mo><msup><mi>X</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>|</mo><msubsup><mo>|</mo><mi>F</mi><mn>2</mn></msubsup><mo>+</mo><mi>&beta;</mi><mo>|</mo><mo>|</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>|</mo><msub><mo>|</mo><mn>1</mn></msub><mo>+</mo><mi>&lambda;</mi><mo>|</mo><mo>|</mo><msup><mi>W</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msup><mo>|</mo><msub><mo>|</mo><mo>*</mo></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000887297190000023.GIF" wi="1309" he="108" /></maths>s.t.diag(W<sup>(l)</sup>)=0上式中<img file="FDA0000887297190000024.GIF" wi="175" he="101" />表示第l类的数据;diag(W<sup>(l)</sup>)=0是为了防止数据的自表示;W<sup>(l)</sup>表示的是同个类别的样本点之间的表示关系,既有通过L<sub>1</sub>范数找出的少数重要的表示样本点,也有通过核范数约束,带有全局约束的样本间表示的低秩特性;上述式子是一个凸优化问题,可以通过LADMAP方法求取最优解;假设已经对训练样本进行排序,即相同类别的训练样本放在一块,对于有监督的学习,把样本点类别信息加以考虑,对于不同类别的样本点,表示系数设为0;最终,对于整个训练样本集的稀疏和低秩表示图,有<img file="FDA0000887297190000025.GIF" wi="509" he="182" />上式中,<img file="FDA0000887297190000026.GIF" wi="195" he="78" />是一个m<sub>l</sub>×m<sub>l</sub>的矩阵,是第l类训练样本的稀疏和低秩表示图;矩阵W表示的是在矩阵稀疏约束和低秩约束的条件下,除自身点以外其他样本点对该点的线性表示,既有通过L<sub>1</sub>范数找出的少数重要的表示样本点,也有通过核范数约束,带有全局约束的样本间表示的低秩特性;反映了样本点之间的流形结构;步骤4、通过最优化准则,寻求最优的投影矩阵,使在投影后的低维流形空间里保持步骤3中所构造的图W的特性;基于图嵌入子空间学习的目标是寻求一个N×K的投影矩阵P(K&lt;N),通过投影变换,在低维空间有Y=P<sup>T</sup>X,为了保持原有空间的流形特性,最优化目标式刻画为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mtable><mtr><mtd><mrow><msub><mi>argmin</mi><mi>P</mi></msub><msubsup><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><mrow><mo>|</mo><mo>|</mo><msup><mi>P</mi><mi>T</mi></msup><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msubsup><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><mrow><msub><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><msup><mi>P</mi><mi>T</mi></msup><msub><mi>x</mi><mi>j</mi></msub></mrow><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><msub><mi>argmin</mi><mi>P</mi></msub><mi>t</mi><mi>r</mi><mrow><mo>(</mo><mrow><msup><mi>P</mi><mi>T</mi></msup><msub><mi>XL</mi><mi>s</mi></msub><msup><mi>X</mi><mi>T</mi></msup><mi>P</mi></mrow><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000887297190000031.GIF" wi="1190" he="199" /></maths>s.t.P<sup>T</sup>XL<sub>p</sub>X<sup>T</sup>P=I上式中,L<sub>s</sub>是图W的拉普拉斯矩阵,L<sub>s</sub>=D‑W,矩阵D是一个对角矩阵,其对角线元素为W矩阵所对应列的所有元素相加之和,即D<sub>ii</sub>=∑<sub>j</sub>W<sub>ij</sub>;L<sub>p</sub>=I,这里P<sup>T</sup>XL<sub>p</sub>X<sup>T</sup>P=I是拉格朗日约束;上述问题的求解是一个广义特征值‑特征向量分解问题,即XL<sub>s</sub>X<sup>T</sup>P=ΛXL<sub>p</sub>X<sup>T</sup>P         (7)其中Λ是广义特征值组成的对角矩阵,每个元素对应一个特征值;P是与之对应的特征向量;步骤5、投影降维;将步骤4)得到的最优投影矩阵P与剩余高光谱数据集的矩阵<img file="FDA0000887297190000032.GIF" wi="48" he="68" />相乘,得到<img file="FDA0000887297190000033.GIF" wi="209" he="71" /><img file="FDA0000887297190000034.GIF" wi="53" he="68" />为在低维空间原始数据的存在形式。
地址 100029 北京市朝阳区北三环东路15号