发明名称 基于视觉词袋模型的遥感图像目标识别方法
摘要 本发明公开了一种基于视觉词袋模型的遥感图像目标识别方法,属于图像识别技术领域。本发明针对传统遥感图像目标检测识别算法效果不佳的缺点,将视觉词袋模型引入到高分辨率遥感图像中用于目标的检测识别,同时为了精简视觉单词码本得到精简且最具鉴别力的视觉单词,本发明结合相关性及冗余度分析去除视觉单词码本中不相关、弱相关以及冗余的视觉单词,选出了对目标识别最为重要的视觉单词,减少了后续测试的计算量,提高了效率,为遥感图像目标的检测识别提供了一个新的研究方向。
申请公布号 CN103440508A 申请公布日期 2013.12.11
申请号 CN201310377651.8 申请日期 2013.08.26
申请人 河海大学;南京小网科技有限责任公司 发明人 李士进;仇建斌;张杰;冯钧;万定生;朱跃龙
分类号 G06K9/66(2006.01)I 主分类号 G06K9/66(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 杨楠
主权项 1.一种基于视觉词袋模型的遥感图像目标识别方法,其特征在于,首先选取各典型类别目标的遥感图像构建训练集;然后分别提取训练集中各遥感图像以及测试遥感图像的视觉词袋特征;最后利用视觉词袋特征比较测试遥感图像与训练集中各遥感图像之间的相似度,如测试遥感图像与训练集中各遥感图像之间的相似度均小于预设的相似度阈值,则判定测试遥感图像不是待识别目标;如否,则判定测试遥感图像为待识别目标,且其类别为与其相似度最大的训练集遥感图像的目标类别;所述视觉词袋特征按照以下方法提取:步骤1、分别提取训练集中各遥感图像的局部特征,并对所提取出的所有局部特征进行聚类,所得到的每个聚类中心作为一个视觉单词,所有聚类中心构成初始视觉单词码本;步骤2、对初始视觉单词码本进行精简,具体如下:步骤2-1、对视觉单词码本中的每一个视觉单词,分别计算其与目标类别集合之间的类别相关性,并将与目标类别集合之间的类别相关性小于一预设相关性阈值的视觉单词从初始视觉单词码本中剔除,得到去相关后的视觉单词码本;初始视觉单词码本中的第i个视觉单词F<sub>i</sub>与目标类别集合C之间的类别相关性<img file="FDA0000372049300000014.GIF" wi="158" he="73" />按照下式计算:<maths num="0001"><![CDATA[<math><mrow><msub><mi>SU</mi><mrow><msub><mi>F</mi><mi>i</mi></msub><mo>,</mo><mi>C</mi></mrow></msub><mo>=</mo><mn>2</mn><mo>[</mo><mfrac><mrow><mi>IG</mi><mrow><mo>(</mo><mi>C</mi><mo>|</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>H</mi><mrow><mo>(</mo><mi>C</mi><mo>)</mo></mrow></mrow></mfrac><mo>]</mo><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mi>K</mi></mrow></math>]]></maths>其中,K为初始视觉单词码本中视觉单词的数目;<img file="FDA0000372049300000012.GIF" wi="720" he="146" />是训练集样本类别的熵,N<sub>c</sub>是目标类别集合中的目标类别总数,P(C=c)表示训练集样本的类别属于目标类别集合C中的第c类目标类别的概率;<img file="FDA0000372049300000013.GIF" wi="786" he="152" />是视觉单词F<sub>i</sub>在所有目标类别样本分布上的熵,P(f<sub>c</sub>=F<sub>i</sub>)表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词F<sub>i</sub>的概率;IG(C|F<sub>i</sub>)是视觉单词F<sub>i</sub>对目标类别分类的信息增益,其计算公式如下:IG(C|F<sub>i</sub>)=H(C)-H(C|F<sub>i</sub>)其中<maths num="0002"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><mi>C</mi><mo>|</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>c</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><munderover><mi>&Sigma;</mi><mrow><msup><mi>c</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><mi>C</mi><mo>=</mo><msup><mi>c</mi><mo>&prime;</mo></msup><mo>|</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>log</mi><mn>2</mn></msub><mi>P</mi><mrow><mo>(</mo><mi>C</mi><mo>=</mo><msup><mi>c</mi><mo>&prime;</mo></msup><mo>|</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>给定视觉单词F<sub>i</sub>时类别的条件信息熵,P(C=c'|f<sub>c</sub>=F<sub>i</sub>)表示训练集样本的局部特征中包含视觉单词F<sub>i</sub>时目标类别集合C中的第c'类目标类别的条件概率;步骤2-2、初始化集合变量W<sub>list</sub>、W<sub>list</sub>'为空;将去相关后的视觉单词码本中的所有视觉单词加入到集合W<sub>list</sub>'中,并按<img file="FDA0000372049300000026.GIF" wi="124" he="74" />值对W<sub>list</sub>'中的所有视觉单词进行降序排列;步骤2-3、对W<sub>list</sub>'中每一当前排序第一的视觉单词F<sub>j</sub>,计算该视觉单词与W<sub>list</sub>'中其他任一视觉单词F<sub>i</sub>,i≠j之间的对称不确定性<img file="FDA0000372049300000027.GIF" wi="165" he="78" />若<img file="FDA0000372049300000028.GIF" wi="338" he="78" />则将F<sub>i</sub>从W<sub>list</sub>'中去除;当F<sub>j</sub>与W<sub>list</sub>'中所有其他视觉单词都计算一轮后,将F<sub>j</sub>加入到集合W<sub>list</sub>中,同时在W<sub>list</sub>'中删除F<sub>j</sub>;视觉单词F<sub>j</sub>和F<sub>i</sub>之间的对称不确定性<img file="FDA0000372049300000029.GIF" wi="141" he="76" />按照下式计算:<maths num="0003"><![CDATA[<math><mrow><msub><mi>SU</mi><mrow><msub><mi>F</mi><mi>i</mi></msub><mo>,</mo><msub><mi>F</mi><mi>j</mi></msub></mrow></msub><mo>=</mo><mn>2</mn><mo>[</mo><mfrac><mrow><mi>IG</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>j</mi></msub><mo>|</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>]</mo></mrow></math>]]></maths>其中,<maths num="0004"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>c</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>log</mi><mn>2</mn></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>c</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>j</mi></msub><mo>)</mo></mrow><msub><mi>log</mi><mn>2</mn></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>分别为视觉单词F<sub>i</sub>、F<sub>j</sub>在所有目标类别样本分布上的熵,P(f<sub>c</sub>=F<sub>i</sub>)、P(f<sub>c</sub>=F<sub>j</sub>)分别表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词F<sub>i</sub>、F<sub>j</sub>的概率;IG(F<sub>j</sub>|F<sub>i</sub>)是视觉单词F<sub>i</sub>对视觉单词F<sub>j</sub>的信息增益,其计算公式如下:IG(F<sub>j</sub>|F<sub>i</sub>)=H(F<sub>j</sub>)-H(F<sub>j</sub>|F<sub>i</sub>)其中,<maths num="0006"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><msub><mi>F</mi><mi>j</mi></msub><mo>|</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>c</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><munderover><mi>&Sigma;</mi><mrow><msup><mi>c</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>c</mi></msub></munderover><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mrow><mi>c</mi><mo>&prime;</mo></mrow></msub><mo>=</mo><msub><mi>F</mi><mi>j</mi></msub><mo>|</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>log</mi><mn>2</mn></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>f</mi><mrow><mi>c</mi><mo>&prime;</mo></mrow></msub><mo>=</mo><msub><mi>F</mi><mi>j</mi></msub><mo>|</mo><msub><mi>f</mi><mi>c</mi></msub><mo>=</mo><msub><mi>F</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow></math>]]></maths>表示给定视觉单词F<sub>i</sub>时视觉单词F<sub>j</sub>的条件信息熵,P(f<sub>c′</sub>=F<sub>j</sub>|f<sub>c</sub>=F<sub>i</sub>)表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词F<sub>i</sub>时类别属于目标类别集合C中的第c'类目标类别的包含视觉单词F<sub>j</sub>的条件概率;步骤2-4、重复步骤2-3的操作,直到集合W<sub>list</sub>'为空;此时集合W<sub>list</sub>即为精简后的视觉单词码本;步骤3、对所要提取特征的一幅遥感图像,将其每个局部特征分配给精简后的视觉单词码本中与其欧式距离最近的视觉单词,然后统计该遥感图像所有局部特征隶属于精简后的视觉单词码本中所有视觉单词的分布直方图,该分布直方图即为该遥感图像的视觉词袋特征。
地址 210098 江苏省南京市江宁开发区佛城西路8号