发明名称 基于稀疏表示和空谱拉普拉斯图的高光谱数据降维方法
摘要 本发明公开了一种用于大规模高光谱数据的降维方法,主要用于解决传统流行学信息单一和该类方法难以处理较大规模数据的问题。其实现步骤为:1.从大规模的高光谱数据中选择一定量的数据作为训练样本;2.对训练样本进行空谱拉普拉斯图的构造;3.对拉普拉斯矩阵进行特征分解得到训练样本的低维表示;4.利用训练样本及其低维表示构造高维字典和低维字典;5.计算剩余高光谱数据在高维字典上的稀疏表示系数;6.将该稀疏表示系数与低维字典进行相乘,得到剩余数据的低维表示;7.整合训练样本与剩余数据的低维表示得到完整的降维数据。本发明提升了流行降维的效果,可用于处理大规模的高光谱数据。
申请公布号 CN104318243A 申请公布日期 2015.01.28
申请号 CN201410542949.4 申请日期 2014.10.14
申请人 西安电子科技大学 发明人 焦李成;陈璞花;杨淑媛;侯彪;王爽;马文萍;马晶晶;刘红英
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 陕西电子工业专利中心 61205 代理人 王品华;朱卫星
主权项 一种基于稀疏表示和空谱拉普拉斯图的高光谱数据降维方法,包括以下步骤:(1)从一幅高光谱图像数据I中选择n个数据点作为高维的训练样本,高光谱数据维数为p,n的数值由高光谱图像数据的规模确定,取整体数目的10%以上;(2)对所选高维训练样本进行空谱拉普拉斯图G的构造:(2a)构造谱间图G1:使用谱信息散度SID作为训练样本点间的距离度量,计算第i个训练样本与其它训练样本间的距离,i=1,…,n,并对这些距离值进行由小到大排序,选择距离最小的N个样本作为第i个训练样本点的N近邻,N=6;根据第i个训练样本点的N近邻确定第i个训练样本点与其它训练样本点的连接关系:若第j个训练样本点在第i个训练样本点的N近邻中,则将第j个训练样本点与第i个训练样本点连接,并计算该连接边的权值<img file="FDA0000586206720000011.GIF" wi="311" he="116" />反之,第j个训练样本点与第i个训练样本点不连接,W′<sub>ij</sub>=0,其中x,y分别为第i个训练样本点与第j个训练样本点所对应的光谱向量,参数t根据实际数据调试确定;(2b)构造空间图G2:比较第i个训练样本点与其它训练样本点的二维坐标,i=1,…,n,确定其它训练样本点是否在第i个训练样本点的K邻域中,若第j个训练样本点在第i个训练样本点的K邻域内,将第i个训练样本点与第j个训练样本点进行连接,反之第i个训练样本点与第j个训练样本点不连接,邻域参数K=11,该参数表示以第i个训练样本点为中心的11*11的邻域区域;确定连接边的权值:将11*11的邻域划分为内邻域和外邻域,内邻域为以第i个训练样本点为中心的5*5的区域,外邻域为除去内邻域的剩余邻域区域;如果第j个训练样本点在第i个训练样本点的内邻域中,则连接边的权值为W″<sub>ij</sub>=1,如果第j个训练样本点在第i个训练样本点的外邻域中,则连接边的权值W″<sub>ij</sub>=0.8;若第i个训练样本点与第j个训练样本点间不存在连接,则W″<sub>ij</sub>=0;(2c)将谱间图G1和空间图G2进行合并操作,保留这两个图中的所有连接边,得到空谱拉普拉斯图G,得到空谱拉普拉斯图G的权值矩阵为W,W=W'+W″,计算拉普拉斯矩阵L,L=D‑W,其中D为由W的行或列求和得到的向量作为对角线元素的对角矩阵;(3)对拉普拉斯矩阵L和对角矩阵D进行广义特征值分解,取最小r个特征值对应的特征向量作为训练样本所对应的低维表示TR;(4)构造高维空间与低维空间的对偶字典:将n个p维的训练样本作为高维字典HD,将n个训练样本对应的r维表示TR作为低维字典LD,这两个字典的原子间存在一一对应的关系;(5)对剩余高光谱数据进行稀疏表示求解,得到剩余高光谱数据在高维字典HD上的稀疏表示系数:Θ=[θ<sub>1</sub>,...,θ<sub>s</sub>,...,θ<sub>m</sub>];(6)将剩余高光谱数据的稀疏表示系数Θ与低维字典LD相乘,得到剩余高光谱数据的r维表示RR=LD*Θ;(7)结合训练样本的r维表示TR,得到整个高光谱数据的r维表示IR=[TR;RR]。
地址 710071 陕西省西安市太白南路2号