发明名称 无人机可见光和红外图像的自适应团块目标检测方法
摘要 本发明公开了一种适用于无人机可见光和红外图像的全局团块目标检测方法,属于图像处理领域。所述方法从图像目标本质出发,依据目标的团聚性,对图像全局范围内目标进行自动检测,适应无人机多种图像载荷的需求,本方法不依赖于目标的运动信息,对动静目标均具有适用性,同时利用无人机机载激光测距系统以及成像设备的参数,建立感兴趣目标模板尺寸表,进一步加快处理速度。采用本发明方法,能够充分利用无人机多载荷资源,提高目标检测的效率和准确率。
申请公布号 CN103942786A 申请公布日期 2014.07.23
申请号 CN201410141183.9 申请日期 2014.04.09
申请人 北京航空航天大学 发明人 丁文锐;刘硕;李红光;袁永显;黎盈婷
分类号 G06T7/00(2006.01)I;G06K9/32(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京永创新实专利事务所 11121 代理人 赵文颖
主权项 一种基于团聚性的适用于无人机可见光和红外图像的目标检测方法,包括以下步骤:第一步,根据无人机的飞行参数获取感兴趣目标的尺寸;根据无人机的任务,获取感兴趣目标的实际尺寸,得到第i个目标的实际长度为L<sub>i</sub>,宽度为W<sub>i</sub>,单位为米,1≤i≤n,n为获取感兴趣目标的数量;获取无人机图像每一个像素所代表实际长度:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>&Delta;x</mi><mo>=</mo><mfrac><mi>H</mi><mi>f</mi></mfrac><mi>&Delta;u</mi></mrow>]]></math><img file="FDA0000488780030000011.GIF" wi="239" he="138" /></maths>其中:Δu表示像元尺寸,H表示飞行高度,f表示焦距,单位为米;根据Δx、L<sub>i</sub>、W<sub>i</sub>得到目标长度和宽度在图像中所占像素个数:<maths num="0002" id="cmaths0002"><math><![CDATA[<mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>l</mi><mi>i</mi></msub><mo>=</mo><mfrac><msub><mi>L</mi><mi>i</mi></msub><mi>&Delta;x</mi></mfrac></mtd></mtr><mtr><mtd><msub><mi>w</mi><mi>i</mi></msub><mo>=</mo><mfrac><msub><mi>W</mi><mi>i</mi></msub><mi>&Delta;x</mi></mfrac></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000488780030000012.GIF" wi="204" he="276" /></maths>其中:l<sub>i</sub>表示第i个目标长度在在图像中所占像素个数,w<sub>i</sub>表示第i个目标宽度在在图像中所占像素个数;第二步,根据目标像素尺寸获取滑动窗口的大小;设滑动窗口为p×p的方形窗口,p的计算公式如下:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>p</mi><mi>i</mi></msub><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>max</mi><mrow><mo>(</mo><msub><mi>l</mi><mi>i</mi></msub><mo>,</mo><msub><mi>w</mi><mi>i</mi></msub><mo>)</mo></mrow></mtd><mtd><mrow><mo>(</mo><mo>|</mo><msub><mi>l</mi><mi>i</mi></msub><mo>-</mo><msub><mi>w</mi><mi>i</mi></msub><mo>|</mo><mo>></mo><mn>15</mn><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mn>1.25</mn><mo>*</mo><mfrac><mrow><msub><mi>l</mi><mi>i</mi></msub><mo>+</mo><msub><mi>w</mi><mi>i</mi></msub></mrow><mn>2</mn></mfrac></mtd><mtd><mrow><mo>(</mo><mo>|</mo><msub><mi>l</mi><mi>i</mi></msub><mo>-</mo><msub><mi>w</mi><mi>i</mi></msub><mo>|</mo><mo>&le;</mo><mn>15</mn><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000488780030000013.GIF" wi="1165" he="219" /></maths>将p<sub>i</sub>从小到大排序,p<sub>1</sub>≤...≤p<sub>i</sub>≤...≤p<sub>n</sub>,以15为步长将模板分成m个等级,其中<img file="FDA0000488780030000014.GIF" wi="281" he="117" />对每个等级的模板求平均,得到k个新的窗口,大小为qk,1≤k≤m;针对第k个新窗口,采用q<sub>k</sub>×q<sub>k</sub>大小的滑动窗口对图像进行遍历;第三步,在滑动窗口中,对目标进行团聚性检测;在第二步的滑动窗口k中,对目标进行团聚性检测,具体为:(1)图像若为可见光图像,转化为灰度图像,图像若为无人机红外图像,直接进入下一个步骤,设i(x,y)表示图像i在(x,y)位置的灰度值;(2)计算图像i的积分图ii(x,y),积分图ii在位置(x,y)的值为图像i中(x,y)左上部分所有像素的灰度值之和,即<img file="FDA0000488780030000021.GIF" wi="501" he="114" />i(x′,y′)表示图像i在(x′,y′)的灰度值;设<img file="FDA0000488780030000022.GIF" wi="450" he="120" />s(x,y)为图像中第x行前y个像素的灰度和,获取ii(x,y):ii(x,y)=ii(x‑1,y)+s(x,y)s(x,y)=s(x,y‑1)+i(x,y)s(x,‑1)=0,ii(‑1,y)=0(3)获取滑动窗口k内所有像素灰度和:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msubsup><mi>S</mi><mi>si</mi><mi>k</mi></msubsup><mo>=</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Dk</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Dk</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Ak</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Ak</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Bk</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Bk</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Ck</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Ck</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000488780030000023.GIF" wi="1108" he="78" /></maths>其中:滑动窗口k四个角点在图像中的位置分别为(x<sub>Ak</sub>,y<sub>Ak</sub>),(x<sub>Bk</sub>,y<sub>Bk</sub>),(x<sub>Ck</sub>,y<sub>Ck</sub>),(x<sub>Dk</sub>,y<sub>Dk</sub>);(4)获取滑动窗口k内目标像素灰度和:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mi>S</mi><mi>ti</mi><mi>k</mi></msubsup><mo>=</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Dkt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Dkt</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Akt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Akt</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Bkt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Bkt</mi></msub><mo>)</mo></mrow><mo>-</mo><mi>ii</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>Ckt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Ckt</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000488780030000024.GIF" wi="1162" he="78" /></maths>其中,(x<sub>Akt</sub>,y<sub>Akt</sub>),(x<sub>Bkt</sub>,y<sub>Bkt</sub>),(x<sub>Ckt</sub>,y<sub>Ckt</sub>),(x<sub>Dkt</sub>,y<sub>Dkt</sub>)表示滑动窗口k中目标四个角点在图像的位置,并且<maths num="0006" id="cmaths0006"><math><![CDATA[<mfenced open='{' close=''><mtable><mtr><mtd><mrow><mo>(</mo><msub><mi>x</mi><mi>Akt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Akt</mi></msub><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mo>[</mo><msub><mi>x</mi><mi>Ak</mi></msub><mo>+</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>,</mo><mo>[</mo><msub><mi>y</mi><mi>Ak</mi></msub><mo>+</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mrow><mo>(</mo><msub><mi>x</mi><mi>Bkt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Bkt</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>(</mo><mo>[</mo><msub><mi>x</mi><mi>Bk</mi></msub><mo>-</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>,</mo><mo>[</mo><msub><mi>y</mi><mi>Bk</mi></msub><mo>+</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>)</mo></mtd></mtr><mtr><mtd><mrow><mo>(</mo><msub><mi>x</mi><mi>Ckt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Ckt</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>(</mo><mo>[</mo><msub><mi>x</mi><mi>Ck</mi></msub><mo>+</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>,</mo><mo>[</mo><msub><mi>y</mi><mi>Ck</mi></msub><mo>-</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>)</mo></mtd></mtr><mtr><mtd><mrow><mo>(</mo><msub><mi>x</mi><mi>Dkt</mi></msub><mo>,</mo><msub><mi>y</mi><mi>Dkt</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>(</mo><mo>[</mo><msub><mi>x</mi><mi>Dk</mi></msub><mo>-</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>,</mo><mo>[</mo><msub><mi>y</mi><mi>Dk</mi></msub><mo>-</mo><mfrac><mn>1</mn><mn>8</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>]</mo><mo>)</mo></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000488780030000025.GIF" wi="802" he="545" /></maths>其中:[A]表示对A进行取整运算;则背景的所有像素灰度和<img file="FDA0000488780030000026.GIF" wi="294" he="78" />(5)根据下式计算团聚性;<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>Agglomeration</mi><mi>i</mi><mi>k</mi></msubsup><mo>=</mo><mo>|</mo><mfrac><msubsup><mi>S</mi><mi>ti</mi><mi>k</mi></msubsup><mrow><msub><mi>t</mi><mi>k</mi></msub><mo>&times;</mo><msub><mi>t</mi><mi>k</mi></msub></mrow></mfrac><mo>-</mo><mfrac><msubsup><mi>S</mi><mi>bi</mi><mi>k</mi></msubsup><mrow><msub><mi>q</mi><mi>k</mi></msub><mo>&times;</mo><msub><mi>q</mi><mi>k</mi></msub><mo>-</mo><msub><mi>t</mi><mi>k</mi></msub><mo>&times;</mo><msub><mi>t</mi><mi>k</mi></msub></mrow></mfrac><mo>|</mo></mrow>]]></math><img file="FDA0000488780030000027.GIF" wi="860" he="162" /></maths>其中,<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>t</mi><mi>k</mi></msub><mo>=</mo><mfrac><mn>3</mn><mn>4</mn></mfrac><msub><mi>q</mi><mi>k</mi></msub><mo>;</mo></mrow>]]></math><img file="FDA0000488780030000028.GIF" wi="211" he="128" /></maths>(6)若<img file="FDA00004887800300000210.GIF" wi="470" he="77" />则判定为目标,记录滑动窗口k的位置<img file="FDA0000488780030000029.GIF" wi="188" he="79" />(7)将<img file="FDA0000488780030000031.GIF" wi="173" he="79" />与<img file="FDA0000488780030000032.GIF" wi="594" he="79" />比较,若<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><mrow><mo>(</mo><mo>|</mo><msubsup><mi>x</mi><mi>i</mi><mi>k</mi></msubsup><mo>-</mo><msubsup><mi>x</mi><mi>j</mi><mi>k</mi></msubsup><mo>|</mo><mo>+</mo><mo>|</mo><msubsup><mi>y</mi><mi>i</mi><mi>k</mi></msubsup><mo>-</mo><msubsup><mi>y</mi><mi>j</mi><mi>k</mi></msubsup><mo>|</mo><mo>)</mo></mrow><mo>&lt;</mo><mn>10</mn><mo>,</mo></mrow>]]></math><img file="FDA0000488780030000033.GIF" wi="545" he="103" /></maths>其中1≤j≤i‑1,<img file="FDA0000488780030000034.GIF" wi="165" he="79" />和<img file="FDA0000488780030000035.GIF" wi="157" he="85" />则为滑动窗口k下的同一目标,去掉团聚性较小的目标;第四步,对不同大小滑动窗口下检测出来的目标进行综合对于大小为k、s的两个滑动窗口,1≤k,s≤m,若<img file="FDA0000488780030000036.GIF" wi="790" he="143" />则判定为同一目标,去掉团聚性较小的目标。
地址 100191 北京市海淀区学院路37号