发明名称 基于仿生鸽群优化视觉注意机制的无人机目标检测方法
摘要 本发明是基于仿生鸽群优化视觉注意机制的无人机目标检测方法,包括步骤如下:步骤一:利用无人机搭载相机获取航拍图像;步骤二:利用视觉注意机制计算图像显著图;其中包括:1、提取图像特征,2、将特征合成为显著图;步骤三:初始化鸽群优化算法参数;其中包括:1、初始化优化参数维数D,2、初始化种群数量N<sub>p</sub>,3、初始化种群位置和速度,4、设置算法迭代次数,5、设置罗盘因数;步骤四:设计代价函数;步骤五:利用鸽群算法计算最佳显著图。在给定目标图像的前提下,可以利用本方法找出目标图像在采集图像中的大体位置,以帮助对于该区域的进一步处理。本方法快速准确,对实现无人机的态势评估和自主决策提供基础与帮助。
申请公布号 CN105654500A 申请公布日期 2016.06.08
申请号 CN201610068933.3 申请日期 2016.02.01
申请人 北京航空航天大学 发明人 段海滨;李晗
分类号 G06T7/00(2006.01)I;G06K9/00(2006.01)I;G06N3/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京慧泉知识产权代理有限公司 11232 代理人 王顺荣;唐爱华
主权项 一种基于仿生鸽群优化视觉注意机制的无人机目标检测方法,其特征在于,包括如下步骤:步骤一:利用无人机搭载相机获取航拍图像无人机搭载工业相机,实时拍摄采集图像,为步骤二提供图像依据;步骤二:利用视觉注意机制计算图像显著图步骤2.1:提取图像特征利用RGB颜色空间模型提取亮度特征,r,g,b分别表示输入图像的红、绿、蓝三个通道,则图像亮度由I=(r+g+b)/3表示;为了消除亮度和颜色通道之间的关系,用亮度I标准化三个颜色通道,则调整后的颜色通道表示为<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>R</mi><mo>=</mo><mi>r</mi><mo>-</mo><mrow><mo>(</mo><mrow><mi>g</mi><mo>+</mo><mi>b</mi></mrow><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></mtd></mtr><mtr><mtd><mrow><mi>G</mi><mo>=</mo><mi>g</mi><mo>-</mo><mrow><mo>(</mo><mrow><mi>r</mi><mo>+</mo><mi>b</mi></mrow><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></mtd></mtr><mtr><mtd><mrow><mi>B</mi><mo>=</mo><mi>b</mi><mo>-</mo><mrow><mo>(</mo><mrow><mi>r</mi><mo>+</mo><mi>g</mi></mrow><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></mtd></mtr><mtr><mtd><mrow><mi>Y</mi><mo>=</mo><mrow><mo>(</mo><mrow><mi>r</mi><mo>+</mo><mi>g</mi></mrow><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>-</mo><mo>|</mo><mi>r</mi><mo>-</mo><mi>g</mi><mo>|</mo><mo>/</mo><mn>2</mn><mo>-</mo><mi>b</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000919313910000011.GIF" wi="1301" he="358" /></maths>其中R,G,B分别表示红、绿、蓝三色,而Y表示黄色;负值归为0;根据大脑皮层对颜色信息的处理过程,由以下公式获得红绿和蓝黄的颜色特征图<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>R</mi><mi>G</mi><mo>=</mo><mi>R</mi><mo>-</mo><mi>G</mi></mrow></mtd></mtr><mtr><mtd><mrow><mi>B</mi><mi>Y</mi><mo>=</mo><mi>B</mi><mo>-</mo><mi>Y</mi></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000919313910000012.GIF" wi="1214" he="174" /></maths>令O(θ)表示当前位置方向,其中θ∈{0°,45°,90°,145°};则输入图像在不同通道上有不同尺度的高斯金字塔;亮度、三个颜色通道和不同方向上的高斯金字塔表示为I(σ),R(σ),G(σ),B(σ),Y(σ),O(σ,θ),其中,σ∈[0,8]表示不同的尺度,θ∈{0°,45°,90°,145°}则表示方向;步骤2.2:将特征合成为显著图中央周边差算子在平滑的中央尺度和粗糙的周围尺度之间生成特征图;操作如下式<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>I</mi><mrow><mo>(</mo><mi>c</mi><mo>,</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mi>I</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mi>&Theta;</mi><mi>I</mi><mo>(</mo><mi>s</mi><mo>)</mo><mo>|</mo></mrow></mtd></mtr><mtr><mtd><mrow><mi>R</mi><mi>G</mi><mrow><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi></mrow><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mrow><mo>(</mo><mrow><mi>R</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>-</mo><mi>G</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mi>&Theta;</mi><mrow><mo>(</mo><mrow><mi>G</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>-</mo><mi>R</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mo>|</mo></mrow></mtd></mtr><mtr><mtd><mrow><mi>B</mi><mi>Y</mi><mrow><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi></mrow><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mrow><mo>(</mo><mrow><mi>B</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mo>-</mo><mi>Y</mi><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mi>&Theta;</mi><mrow><mo>(</mo><mrow><mi>Y</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>-</mo><mi>B</mi><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mo>|</mo></mrow></mtd></mtr><mtr><mtd><mrow><mi>O</mi><mrow><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi><mo>,</mo><mi>&theta;</mi></mrow><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mi>O</mi><mrow><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>&theta;</mi></mrow><mo>)</mo></mrow><mi>&Theta;</mi><mi>O</mi><mrow><mo>(</mo><mrow><mi>s</mi><mo>,</mo><mi>&theta;</mi></mrow><mo>)</mo></mrow><mo>|</mo></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000919313910000021.GIF" wi="1462" he="423" /></maths>其中,θ∈{0°,45°,90°,145°},Θ为对不同尺度特征图c和s之间进行计算,c∈{2,3,4},s=c+δ,δ∈{3,4}.公式(8)计算得42幅特征图,包括6幅亮度特征图,12幅颜色特征图和24幅方向特征图,接下来需要通过下式计算原始输入图像的显著图:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></munderover><msub><mi>K</mi><mrow><mn>1</mn><mi>i</mi></mrow></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mn>12</mn></munderover><msub><mi>K</mi><mrow><mn>2</mn><mi>j</mi></mrow></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mn>24</mn></munderover><msub><mi>K</mi><mrow><mn>3</mn><mi>k</mi></mrow></msub></mrow></mfrac><mo>&times;</mo><mrow><mo>&lsqb;</mo><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>6</mn></munderover><msub><mi>K</mi><mrow><mn>1</mn><mi>i</mi></mrow></msub><mo>&times;</mo><mi>I</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mn>12</mn></munderover><msub><mi>K</mi><mrow><mn>2</mn><mi>j</mi></mrow></msub><mo>&times;</mo><mi>C</mi><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mn>24</mn></munderover><msub><mi>K</mi><mrow><mn>3</mn><mi>k</mi></mrow></msub><mo>&times;</mo><mi>O</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>&rsqb;</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000919313910000022.GIF" wi="1918" he="247" /></maths>其中,K<sub>1i</sub>,K<sub>2j</sub>,K<sub>3k</sub>分别是亮度、颜色和方向图的加权系数;步骤三:初始化鸽群优化方法参数步骤3.1:初始化优化参数维数D由于需要计算加权线性方程最优加权系数,其中共有42个系数需要优化,所以D为42;步骤3.2:初始化种群数量N<sub>p</sub>种群数量N<sub>p</sub>对优化方法的效果有影响;种群数量小时易陷入局部最优;当种群数量大时,优化方法收敛效果好,但计算耗时将延长;步骤3.3:初始化种群位置和速度种群在解空间中的位置和速度都是随机初始化的结果;初始化依据下式进行:X<sub>i</sub>=X<sub>l</sub>+rand·(X<sub>h</sub>‑X<sub>l</sub>)   (10)式中,rand为0到1之间的随机数;X<sub>h</sub>和X<sub>l</sub>分别表示给定的最大值和最小值;步骤3.4:设置优化方法迭代次数优化方法迭代次数对优化方法的效果影响大;当优化方法迭代次数少,会使优化方法没有得到最优解即停止;当迭代次数大时,优化方法早已收敛;因此需要对两个分别设置迭代次数上限;步骤3.5:设置罗盘因数罗盘因数作为固定参数,需要通过多次测试获取结果;设定成0‑1范围内的数;该罗盘因数决定了优化方法的收敛速度和计算准确度;步骤四:设计代价函数代价函数直接决定优化方法表现的优劣;由于基于仿生鸽群优化视觉注意机制的无人机目标检测方法中需要计算的是解空间中的最佳位置,定义代价函数为信噪比,其中信号是指所选择的显著区域的平均亮度,噪声则是指显著图背景的平均亮度;基于仿生鸽群优化视觉注意机制的无人机目标检测方法通过多次试验得出信噪比较高的情况下线性方程的系数,并将该组系数用于测试图中以得到显著图;步骤五:利用鸽群方法计算最佳显著图首先需要在初始化参数的情况下计算代价函数,通过对比得出当前鸽群中个体的最佳位置;然后运行地图和罗盘算子,更新每一只鸽子的速度和位置,比对代价函数得出最佳位置,直到达到设置的地图和罗盘算子的迭代次数上限停止该算子,运行地标算子;根据当前鸽子所在未知的代价函数对鸽子排序,忽略排序在后半的鸽子个体,计算其余鸽子的中心位置,设置该位置为目标,调整鸽子的飞行方向;当迭代次数达到所设置的迭代上限时停止地标算子;步骤六:储存结果并验证当停止寻优后,记录当前的全局最优位置,即所求的加权系数;重复上述步骤一到步骤五,对多幅图进行训练,并计算多组加权系数的平均值,作为测试图的最优加权系数;在每一次寻优过程中保存迭代曲线。
地址 100191 北京市海淀区学院路37号自动化科学与电气工程学院