发明名称 基于特征选择和半监督学的遥感图像检索方法
摘要 本发明公开了一种基于特征选择和半监督学的遥感图像检索方法,首先根据最小描述长度准则和改进的Davies-Bouldin指数,利用聚类方法分别选出最优的颜色特征和纹理特征;然后根据最优的颜色特征和纹理特征的二值化权重选择合适的半监督学方法进行遥感图像的检索。相比较现有的遥感图像检索方法,本发明不仅可以大大提高检索质量,还能有效减少检索过程中计算量,提高检索的速度。
申请公布号 CN101853304A 申请公布日期 2010.10.06
申请号 CN201010195139.8 申请日期 2010.06.08
申请人 河海大学 发明人 李士进;朱佳丽;朱跃龙;万定生;冯钧;余宇峰
分类号 G06F17/30(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 1.一种基于特征选择和半监督学习的遥感图像检索方法,首先选择待检索图像的特征,然后根据选择出的特征构造相应的分类器进行检索,其特征在于:所述选择待检索图像的特征是指:根据最小描述长度准则和改进的DB指数,通过聚类分析的方法选择待检索图像的最优颜色特征和最优纹理特征;具体通过以下各步骤实现:步骤1)将待检索图像进行分块;步骤2)分别提取待检索图像的各个颜色特征和纹理特征;步骤3)根据最小描述长度准则确定聚类数目k,具体按照如下各步骤:步骤31)根据最远距离准则初始化m个聚类中心;步骤32)任意设定某一聚类中心C<sub>j</sub>,根据下述公式计算<img file="FSA00000156084100011.GIF" wi="312" he="64" />表示假设将C<sub>j</sub>移除时,移除前后编码长度的总变化量:<maths num="0001"><![CDATA[<math><mrow><msub><mi>&Delta;l</mi><msub><mi>C</mi><mi>j</mi></msub></msub><mo>=</mo><mo>-</mo><msub><mi>L</mi><mn>0</mn></msub><mo>-</mo><msub><mi>n</mi><mi>j</mi></msub><msub><mi>log</mi><mn>2</mn></msub><msub><mi>p</mi><mi>j</mi></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>q</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>q</mi><mo>&NotEqual;</mo><mi>j</mi></mrow><mi>m</mi></munderover><msub><mi>n</mi><mi>jq</mi></msub><msub><mi>log</mi><mn>2</mn></msub><mrow><mo>(</mo><mfrac><mrow><msub><mi>n</mi><mi>q</mi></msub><mo>+</mo><msub><mi>n</mi><mi>jq</mi></msub></mrow><mrow><mo>|</mo><mi>I</mi><mo>|</mo></mrow></mfrac><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mrow><mi>x</mi><mo>&Element;</mo><msub><mi>c</mi><mi>j</mi></msub></mrow></munder><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>d</mi></munderover><mfrac><mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>c</mi><mi>iq</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>c</mi><mi>ij</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><mrow><mo>(</mo><mi>ln</mi><mn>2</mn><mo>)</mo></mrow><msup><mi>&sigma;</mi><mn>2</mn></msup></mrow></mfrac></mrow></math>]]></maths>其中,L<sub>0</sub>表示聚类簇中心的编码长度:<maths num="0002"><![CDATA[<math><mrow><msub><mi>L</mi><mn>0</mn></msub><mo>=</mo><msqrt><mn>9</mn><mo>&times;</mo><mi>&sigma;</mi><mo>&times;</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mrow><mo>(</mo><mo>-</mo><msub><mi>n</mi><mi>j</mi></msub><msub><mi>log</mi><mn>2</mn></msub><msub><mi>p</mi><mi>j</mi></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>q</mi><mo>=</mo><mn>1</mn><mo>,</mo><mi>q</mi><mo>&NotEqual;</mo><mi>j</mi></mrow><mi>m</mi></munderover><msub><mi>n</mi><mi>jq</mi></msub><msub><mi>log</mi><mn>2</mn></msub><mrow><mo>(</mo><mfrac><mrow><msub><mi>n</mi><mi>q</mi></msub><mo>+</mo><msub><mi>n</mi><mi>jq</mi></msub></mrow><mrow><mo>|</mo><mi>I</mi><mo>|</mo></mrow></mfrac><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mrow><mi>x</mi><mo>&Element;</mo><msub><mi>c</mi><mi>j</mi></msub></mrow></munder><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>d</mi></munderover><mfrac><mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>c</mi><mi>iq</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><msub><mi>c</mi><mi>ij</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><mrow><mn>2</mn><mrow><mo>(</mo><mi>ln</mi><mn>2</mn><mo>)</mo></mrow><msup><mi>&sigma;</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>/</mo><mi>m</mi></msqrt><mo>;</mo></mrow></math>]]></maths>n<sub>q</sub>表示第q簇聚类样本的数目;n<sub>jq</sub>表示满足最近邻参考点为第j个聚类中心而第二近邻参考点为第q个聚类中心的样本数目,d表示特征的维数,x是簇C<sub>j</sub>中的样本成员,x<sub>i</sub>是第i个特征的数值;c<sub>iq</sub>表示第q个聚类中心的第i维的值,c<sub>ij</sub>表示第j个聚类中心的第i维的值;|I|表示总的样本数目;p<sub>j</sub>表示第C<sub>j</sub>簇聚类样本在总体样本中所占的比重;σ是样本数据的方差,取值范围是[0.1,0.2];步骤33)判断步骤33中得到的<img file="FSA00000156084100014.GIF" wi="101" he="64" />是否小于0,如是,则移除聚类中心C<sub>j</sub>;如否,则保留聚类中心C<sub>j</sub>;步骤34)迭代执行步骤32-步骤33,直到没有冗余的聚类中心,此时保留下来的聚类中心数目即为需确定的聚类数目k;步骤4)根据步骤3确定的聚类数目k利用K-means聚类方法分别对步骤2中提取的每个特征进行聚类;步骤5)按照如下公式分别计算步骤4中得到的每个特征的改进的DB指数,并分别选出颜色特征中改进的DB指数最小的颜色特征和纹理特征中改进的DB指数最小的纹理特征,作为最优颜色特征和最优纹理特征:<maths num="0003"><![CDATA[<math><mrow><msub><mi>S</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><mo>|</mo><msub><mi>C</mi><mi>t</mi></msub><mo>|</mo></mrow></mfrac><munder><mi>&Sigma;</mi><mrow><mi>x</mi><mo>&Element;</mo><msub><mi>C</mi><mi>t</mi></msub></mrow></munder><mi>D</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><msub><mi>p</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><msub><mi>DB</mi><mi>c</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munder><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow></munder><mrow><mi>i</mi><mo>&NotEqual;</mo><mi>t</mi></mrow></munder><mfrac><mrow><mn>1</mn><mo>/</mo><msub><mi>S</mi><mi>t</mi></msub></mrow><mrow><mn>1</mn><mo>/</mo><mi>D</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><msub><mi>p</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mfrac><mn>1</mn><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow></munder><mrow><mi>i</mi><mo>&NotEqual;</mo><mi>t</mi></mrow><mi>k</mi></munderover><mfrac><mrow><mi>D</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><msub><mi>p</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow><msub><mi>S</mi><mi>t</mi></msub></mfrac></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><msub><mi>DB</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow></munder><mrow><mi>i</mi><mo>&NotEqual;</mo><mi>t</mi></mrow><mi>k</mi></munderover><mfrac><msub><mi>S</mi><mi>t</mi></msub><mrow><mi>D</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><msub><mi>p</mi><mi>t</mi></msub><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>其中,D(·)是一个距离算子,对于颜色特征,D(·)表示直方图交距离;而对于纹理特征,D(·)表示欧式距离;t是目标子类的簇编号;S<sub>t</sub>是目标子类t中所有样本到聚类中心的平均距离;|C<sub>t</sub>|是目标子类t中的样本数目;p<sub>t</sub>是目标子类t的聚类中心;k表示总的聚类数目;p<sub>i</sub>表示非目标子类的聚类中心;DB<sub>c</sub>表示颜色特征的改进的DB指数;DB<sub>t</sub>表示纹理特征的改进的DB指数。
地址 210098 江苏省南京市鼓楼区西康路1号