发明名称 联合解混及自适应端元提取的高光谱图像分类方法
摘要 本发明公开了一种联合解混及自适应端元提取的高光谱图像分类方法,用于解决现有基于光谱解混的高光谱图像分类方法误差大的技术问题。技术方案是首先对图像进行粗分类,继而利用混淆矩阵实现各类别的端元集提取。通过获得的端元集对各类别中的训练样本进行线性光谱解混,利用其丰度值优化基于多元逻辑回归的概率分类器,获得较优分类结果。根据分类结果实现类别的端元集更新。迭代此过程,不断优化分类器,提高了分类精度。本发明在模拟数据集和两个真实高光谱数据集AVIRIS Indian Pine数据和ROSIS Pavia University数据上的测试结果表明,平均精度分别为81.98%,62.19%,82.38%。
申请公布号 CN103310230B 申请公布日期 2016.04.13
申请号 CN201310240655.1 申请日期 2013.06.17
申请人 西北工业大学 发明人 张艳宁;魏巍;孟庆洁;张磊
分类号 G06K9/64(2006.01)I 主分类号 G06K9/64(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 王鲜凯
主权项 一种联合解混及自适应端元提取的高光谱图像分类方法,其特征在于包括以下步骤:步骤一、采用基于统计理论的最大似然分类算法对原始高光谱图像进行粗分类;当原始高光谱图像样本数量U满足U&gt;1000,每类随机选择5‰的像元作为训练样本,100&lt;U&lt;1000则每类随机选择5%像元作为训练样本,否则随机选择5个像元作为训练样本;对原始高光谱图像数据采用主成分分析方法实现数据降维;步骤二、采用混淆矩阵作为筛选类别端元集的依据,通过迭代不断更新端元集;将GIS数据计算类别平均光谱作为端元光谱;设图像共有N个像元,像元集合为X=[x<sub>1</sub>,x<sub>2</sub>,...,x<sub>N</sub>],图像有K个波段<img file="FDA0000908748280000011.GIF" wi="166" he="69" />像元的类标签集合为Y=[y<sub>1</sub>,y<sub>2</sub>,...,y<sub>N</sub>],共有M个类别,因此像元x<sub>i</sub>的类标签y<sub>i</sub>满足<img file="FDA0000908748280000012.GIF" wi="487" he="86" />图像中任意一个类别m<sub>i</sub>的端元集提取过程如下:(1)计算各个类别的平均光谱作为端元光谱e<sub>i</sub>,获得图像的端元集Ε=[e<sub>1</sub>,e<sub>2</sub>,...,e<sub>M</sub>];其中,N<sub>i</sub>表示第i类的像元个数,<img file="FDA0000908748280000013.GIF" wi="76" he="79" />表示第i类的第j个像元;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>e</mi><mi>i</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>i</mi></msub></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>i</mi></msub></munderover><msubsup><mi>x</mi><mi>j</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000908748280000014.GIF" wi="1349" he="149" /></maths>(2)利用混淆矩阵<img file="FDA0000908748280000015.GIF" wi="203" he="65" />统计第i类地物m<sub>i</sub>错分到其他类别的像元个数;设定阈值λ,满足0&lt;λ&lt;&lt;1,对于第j类地物,若第i类像元错分到第j类的像元个数C<sub>ij</sub>与第i类分对的像元个数C<sub>ii</sub>之比大于阈值λ,则将第j类的端元加入到第i类地物的端元集Β<sub>i</sub>中,Β<sub>i</sub>为图像端元集Ε的子集;Q={t|C<sub>it</sub>≠0,C<sub>it</sub>≥λC<sub>ii</sub>,t∈Μ}            (2)Β<sub>i</sub>=Ε<sub>Q</sub>,i∈Μ                   (3)其中,Q表示混淆矩阵中满足条件的类别号的集合;Β<sub>i</sub>表示由相应类别号从图像端元集Ε中选择对应的端元组成第i类地物的端元集;λ是阈值;(3)根据以上过程获得各个类别相应的端元集Β<sub>i</sub>,针对第i类地物中的混合像元,利用其端元集合Β<sub>i</sub>进行线性光谱解混,获得混合像元的丰度值信息;步骤三、采用线性光谱解混模型估计混合像元的丰度值信息;实际的高光谱数据丰度值系数A=[a<sub>1</sub>,a<sub>2</sub>,...,a<sub>M</sub>]需要满足<img file="FDA0000908748280000021.GIF" wi="349" he="135" />采用全约束的最小二乘方法<img file="FDA0000908748280000022.GIF" wi="309" he="143" />条件的混合像元丰度值信息;步骤四、利用基于多元逻辑回归的概率分类器估计像元的概率类标签;其中,混合像元采用其丰度值信息优化MLR的回归系数ω;具体的回归参数估计过程如下:(1)x<sub>i</sub>的类标签为<img file="FDA0000908748280000023.GIF" wi="509" he="77" />当y<sub>i</sub>中仅含有一个值时,x<sub>i</sub>为纯净像元,否则为混合像元;MLR模型的回归系数为<img file="FDA0000908748280000024.GIF" wi="663" he="76" />利用最大后验概率法估计回归系数<img file="FDA0000908748280000025.GIF" wi="77" he="61" />如公式(4)和公式(5);使用L个标记样本组成标记样本集D<sub>L</sub>={(y<sub>1</sub>,x<sub>1</sub>),(y<sub>2</sub>,x<sub>2</sub>),...,(y<sub>L</sub>,x<sub>L</sub>)}作为训练样本集,其中,包含的混合像元的类标签是其丰度值;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><mi>&omega;</mi><mo>^</mo></mover><mo>=</mo><munder><mrow><mi>arg</mi><mi> </mi><mi>m</mi><mi>a</mi><mi>x</mi></mrow><mi>&omega;</mi></munder><mi>l</mi><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000908748280000026.GIF" wi="1302" he="102" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>l</mi><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>=</mo><mi>l</mi><mi>o</mi><mi>g</mi><munderover><mo>&Pi;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></munderover><mi>p</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></munderover><mrow><mo>(</mo><munderover><mo>&Sigma;</mo><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msubsup><mi>y</mi><mi>i</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></msubsup><msup><mi>&omega;</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo><mi>T</mi></mrow></msup><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mi>l</mi><mi>o</mi><mi>g</mi><munderover><mo>&Sigma;</mo><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mi>exp</mi><mo>(</mo><mrow><msup><mi>&omega;</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo><mi>T</mi></mrow></msup><msub><mi>x</mi><mi>i</mi></msub></mrow><mo>)</mo><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000908748280000027.GIF" wi="1742" he="151" /></maths>(2)根据回归系数<img file="FDA0000908748280000028.GIF" wi="77" he="60" />建立多元逻辑回归模型,用于计算像元概率类标签;<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msubsup><mi>y</mi><mi>i</mi><mi>t</mi></msubsup><mo>=</mo><mn>1</mn><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><mover><mi>&omega;</mi><mo>^</mo></mover><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>exp</mi><mrow><mo>(</mo><msup><mover><mi>&omega;</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>)</mo><mi>T</mi></mrow></msup><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mi>exp</mi><mrow><mo>(</mo><msup><mover><mi>&omega;</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>j</mi><mo>)</mo><mi>T</mi></mrow></msup><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000908748280000029.GIF" wi="1467" he="215" /></maths>步骤五、利用MLR分类器对待分类像元分配概率类标签,具体分类步骤如下:(1)将待分类像元x<sub>j</sub>输入MLR分类器,估计像元属于第i类地物的概率<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>i</mi></msubsup><mo>=</mo><mn>1</mn><mo>|</mo><msub><mi>x</mi><mi>j</mi></msub><mo>,</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA00009087482800000210.GIF" wi="349" he="78" /></maths>(2)选择概率最大的类别作为像元的所属类别;<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>x</mi><mi>j</mi></msub><mo>&Element;</mo><msub><mi>m</mi><mi>t</mi></msub><mo>,</mo><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>t</mi></msubsup><mo>=</mo><mn>1</mn><mo>|</mo><msub><mi>x</mi><mi>j</mi></msub><mo>,</mo><mover><mi>&omega;</mi><mo>^</mo></mover><mo>)</mo></mrow><mo>=</mo><mi>arg</mi><mi> </mi><mi>m</mi><mi>a</mi><mi>x</mi><mo>{</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>y</mi><mi>j</mi><mi>i</mi></msubsup><mo>=</mo><mn>1</mn><mo>|</mo><msub><mi>x</mi><mi>j</mi></msub><mo>,</mo><mover><mi>&omega;</mi><mo>^</mo></mover><mo>)</mo></mrow><mo>}</mo><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>M</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00009087482800000211.GIF" wi="1710" he="78" /></maths>步骤六、根据以上分类结果获得混淆矩阵,重复步骤二到步骤六;通过更新各类端元集,实现MLR分类器的优化。
地址 710072 陕西省西安市友谊西路127号