发明名称 一种基于图像显著性与SVM的飞机目标检测方法
摘要 本发明涉及一种基于图像显著性与SVM的飞机目标检测方法,显著性区域检测中有两种视觉注意方式,分别是:自底向上(数据驱动)的注意方式、自顶向下(任务驱动)的注意方式。本发明先提取训练样本的方向梯度直方图(HOG)特征,训练支持向量机(SVM)分类器,然后使用一种基于剩余谱理论的自底向上的视觉注意模型进行显著性区域检测,快速提取可能存在目标的候选区域,然后提取候选区域的HOG特征,再使用训练好的SVM分类器对候选区域进行分类,完成目标检测。
申请公布号 CN105956592A 申请公布日期 2016.09.21
申请号 CN201610303628.8 申请日期 2016.05.10
申请人 西北工业大学 发明人 李映;聂金苗;陈迪
分类号 G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/32(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 王鲜凯
主权项 一种基于图像显著性与SVM的飞机目标检测方法,其特征在于步骤如下:步骤1、数据准备:从公众可获得的各类图像中选取可见光机场图像作为训练样本及待检测目标图集,并转换为灰度图,图中飞机的最大外接正方形的尺寸从最小值:a<sub>1</sub>×a<sub>1</sub>,至最大值为a<sub>2</sub>×a<sub>2</sub>;选取部分图像作为训练样本,将图像中飞机区域切割后作为正样本,其他区域切割后作为负样本;剩余的部分图像作为测试样本;所述的训练的样本缩放为a<sub>3</sub>×a<sub>3</sub>大小的尺寸;步骤2:分别提取正负训练样本的HOG特征;步骤3:将提取到的每一个正负样本的HOG特征与其类别标签,正样本为1,负样本为‑1组合成一个向量,训练SVM分类器;步骤4:采用基于剩余谱理论的显著性检测方法获取测试样本中图像的显著图;步骤5:通过面积阈值化方法提取显著图中的连通域,产生飞机目标的候选区域,过程如下:步骤5a:首先计算显著图的均值<img file="FDA0000985415790000011.GIF" wi="43" he="69" />和方差<img file="FDA0000985415790000012.GIF" wi="85" he="64" /><maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mo>=</mo><mfrac><mn>1</mn><mrow><mi>w</mi><mi>h</mi></mrow></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>h</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>w</mi></munderover><mi>S</mi><mi>a</mi><mi>l</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000985415790000013.GIF" wi="438" he="135" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mover><msup><mi>&delta;</mi><mn>2</mn></msup><mo>&OverBar;</mo></mover><mo>=</mo><mfrac><mn>1</mn><mrow><mi>w</mi><mi>h</mi></mrow></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>h</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>w</mi></munderover><msup><mrow><mo>(</mo><mi>S</mi><mi>a</mi><mi>l</mi><mo>(</mo><mrow><mi>i</mi><mo>,</mo><mi>j</mi></mrow><mo>)</mo><mo>-</mo><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></mrow>]]></math><img file="FDA0000985415790000014.GIF" wi="589" he="134" /></maths>其中,w表示图像的宽,h表示图像的高,Sal(i,j)表示显著图中第i行第j列的像素值;步骤5b:利用显著图的均值<img file="FDA0000985415790000015.GIF" wi="49" he="70" />和方差<img file="FDA0000985415790000016.GIF" wi="57" he="62" />计算阈值T,以该阈值T分割显著图;所述阈值T:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>T</mi><mo>=</mo><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mo>+</mo><mi>k</mi><mo>&CenterDot;</mo><mover><mi>&delta;</mi><mo>&OverBar;</mo></mover></mrow>]]></math><img file="FDA0000985415790000017.GIF" wi="262" he="69" /></maths>系数k是为了平衡标准差<img file="FDA0000985415790000018.GIF" wi="34" he="61" />和均值<img file="FDA0000985415790000019.GIF" wi="43" he="70" />在阈值T取值时的权重<img file="FDA00009854157900000110.GIF" wi="346" he="70" />步骤5c、对阈值化后的显著图进行连通域滤波:以大小为n<sub>1</sub>×n<sub>1</sub>的矩形窗,以第i行第j列像素(i,j)为中心截取一个邻域;以某区域的像素个数来定义该区域的面积,求出处于所述邻域范围内的显著区域的面积;如果该面积大于一定阈值,就保留该区域,否则不保留;将所有保留下来的区域作为飞机目标的候选区域;步骤6:从飞机目标的候选区域提取飞机目标,过程如下:步骤6a、构建响应矩阵:构建一个二维的响应矩阵M,矩阵中每个元素的取值为一个二维数组M<sub>i,j</sub>(s,r)其中i∈[1,w],j∈[1,h],s用于记录窗口尺寸,r用于记录存在飞机目标的窗口所产生的SVM响应;初始化时,该响应矩阵初始化为一个与图像大小相同的全0矩阵;以任一候选区域的局部像素极大值作为该候选区域的中心,称为:种子点;步骤6b、二次窗口法剔除无效种子点,保留最可能的飞机区域,过程如下:(A)确定第一次图像块窗口:窗口是一个以种子点为中心的矩形窗口,窗口的尺寸为h<sub>1</sub>×h<sub>1</sub>,其中:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>h</mi><mn>1</mn></msub><mo>=</mo><mi>int</mi><mrow><mo>(</mo><mfrac><msub><mi>a</mi><mn>3</mn></msub><mn>2</mn></mfrac><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000985415790000021.GIF" wi="294" he="103" /></maths>其中,int()函数表示四舍五入取整。以该窗口对原图像进行截取,将截取到的图像块缩放为a<sub>3</sub>×a<sub>3</sub>大小,提取图像块的HOG特征,然后将HOG特征代入到SVM分类器中,计算SVM分类器响应值r<sub>1</sub>;(B)确定第二次图像块窗口:窗口是一个以种子点为中心的矩形窗口,窗口的尺寸为h<sub>2</sub>×h<sub>2</sub>,其中:h<sub>2</sub>=2(h<sub>1</sub>‑1)+1以该窗口对原图像进行截取,将截取到的图像块缩放为a<sub>3</sub>×a<sub>3</sub>大小,提取图像块的HOG特征,然后将HOG特征代入到SVM分类器中,计算SVM分类器响应值r<sub>2</sub>;(C)判断是否保留该区域:如果两次计算得到的分类器响应值均小于0,则认为该种子点对应的飞机候选区域无效,因此剔除该无效种子点;否则,认为窗口包含的区域存在飞机或包含了飞机的大部分机身,将该两次响应中的较大值赋值到响应矩阵中种子点对应的坐标位置上,称为响应矩阵的种子点,并记录下该响应对应的窗口尺寸;具体地,设当前坐标为:(u,v),将需要记录的SVM分类器响应值,赋给响应矩阵的种子点处元素M(u,v)的二维数组中的r值;将产生该响应时对应的截取窗口尺寸中的正方形边长值,赋给响应矩阵的种子点处元素M(u,v)的二维数组中的s值;步骤6c、优化响应矩阵,确定飞机区域:(1)优化每个种子点中记录的窗口尺寸:对每一个响应矩阵的种子点,先根据以下公式计算变换后的窗口边长值h<sub>3</sub>:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>h</mi><mn>3</mn></msub><mo>=</mo><mi>s</mi><mo>-</mo><mi>int</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>h</mi><mn>2</mn></msub><mo>-</mo><msub><mi>h</mi><mn>1</mn></msub></mrow><mn>3</mn></mfrac><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000985415790000031.GIF" wi="382" he="118" /></maths>以响应矩阵的种子点处的坐标为中心,以h<sub>3</sub>×h<sub>3</sub>为窗口尺寸建立截取窗口对原图像进行截取,将截取到的图像块缩放为a<sub>3</sub>×a<sub>3</sub>大小,提取图像块的HOG特征,然后将HOG特征代入到SVM分类器中,计算SVM分类器响应值r<sub>3</sub>;再根据以下公式计算变换后的窗口边长值h<sub>4</sub>:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>h</mi><mn>4</mn></msub><mo>=</mo><mi>s</mi><mo>+</mo><mi>int</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>h</mi><mn>2</mn></msub><mo>-</mo><msub><mi>h</mi><mn>1</mn></msub></mrow><mn>3</mn></mfrac><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000985415790000032.GIF" wi="382" he="117" /></maths>以响应矩阵的种子点处的坐标为中心,以h<sub>4</sub>×h<sub>4</sub>为窗口尺寸建立截取窗口对原图像进行截取,将截取到的图像块缩放为a<sub>3</sub>×a<sub>3</sub>大小,提取图像块的HOG特征,然后将HOG特征代入到SVM分类器中,计算SVM分类器响应值r<sub>4</sub>;找出r,r<sub>3</sub>,r<sub>4</sub>中的最大值,替换响应矩阵的种子点处元素的二维数组中原有的r值,以所述新的r值对应的窗口边长值替换响应矩阵的种子点处元素的二维数组中原有的s值;确定飞机区域,得到最终目标检测结果;(2)依据优化后的响应矩阵,以响应矩阵的种子点处记录的坐标作为原图像中飞机目标所在正方形区域的中心,以该种子点处记录的s值作为原图像中飞机目标所在正方形区域的边长,即可确定每个飞机区域,得到最终的飞机目标检测结果。
地址 710072 陕西省西安市友谊西路127号
您可能感兴趣的专利