发明名称 一种基于深度置信网络的三维SAR图像目标识别方法
摘要 本发明提出了一种基于深度置信网络的三维SAR图像目标识别方法,首先建立三维SAR图像的仿真样本库,通过一副或少数的目标的三维SAR图像向不同的方位角和俯仰角投影得到多幅目标的二维SAR图像,获取的少量的三维SAR图像转化成二维图像,利用二维图像识别的方法进行识别,可以大大的节省成本,减少SAR成像的获取时间。提出了融合交叉验证法对深度置信网络进行了改进使之自动调节参数,实现参数的自优化,有效的避免过拟合学和欠拟合学状态的发生,能准确地学样本数据的高级特性,使深度置信网络获得更好的识别结果省去了人工设置参数的繁琐,提高了识别效率。
申请公布号 CN106355151A 申请公布日期 2017.01.25
申请号 CN201610777874.7 申请日期 2016.08.30
申请人 电子科技大学 发明人 张晓玲;蒲羚;周灵杰;范小天;韦顺军;徐三元
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 电子科技大学专利中心 51203 代理人 曾磊
主权项 一种基于深度置信网络的三维SAR图像的目标识别方法,其特征是它包括以下步骤:步骤1、初始化阵列三维SAR系统参数:初始化阵列三维SAR系统参数,包括:光在空气中传播速度,记为C;频率采样点数,记为N<sub>r</sub>;雷达发射的基带信号形式为步进频率信号,子脉冲频率记为f<sub>i</sub>=f<sub>0</sub>+i·Δf,其中f<sub>0</sub>为信号起始频率,Δf为步进频率增量,i为子脉冲序号,i=1,2,3,…,N<sub>r</sub>;雷达发射基带信号的信号带宽,记为B=(N<sub>r</sub>‑1)Δf;雷达工作中心频率,记为f<sub>c</sub>=f<sub>0</sub>+B/2;接收阵列中心,记为<img file="FDA0001100968940000011.GIF" wi="322" he="86" />阵列阵元总数记为N=N<sub>x</sub>·N<sub>y</sub>,其中N<sub>x</sub>为方位向阵元数,N<sub>y</sub>为垂直方位向阵元数;阵元间隔记为d;阵列天线各阵元位置矢量,记做<img file="FDA0001100968940000012.GIF" wi="799" he="94" />其中n为天线各阵元序号,为自然数,n=1,2,...,N,n<sub>x</sub>为方位向序列号,n<sub>x</sub>=‑N<sub>x</sub>/2,...,N<sub>x</sub>/2,n<sub>y</sub>为垂直方位向序列号,n<sub>y</sub>=‑N<sub>y</sub>/2,...,N<sub>y</sub>/2;成像场景中心,记为<img file="FDA0001100968940000013.GIF" wi="336" he="79" />以雷达波束照射场区域地平面和垂直于该地平面向上的单位向量所构成的空间直角坐标作为线阵三维SAR的场景目标空间Ω;场景目标空间Ω中点目标的矢量坐标,记做<img file="FDA0001100968940000014.GIF" wi="83" he="69" />m表示场景目标空间Ω中第m个点目标,m=1,2,…,M,M为场景目标空间Ω中点目标总数,其中<img file="FDA0001100968940000015.GIF" wi="58" he="70" />和M的值由电磁仿真选择的模型决定;步骤2、电磁仿真得到目标的表面电磁散射系数:将步骤1中初始化的阵列三维SAR系统参数输入电磁仿真软件FEKO中,采用传统通用的电磁计算仿真方法,得到第m个点目标的表面电磁散射系数矩阵,记为:<img file="FDA0001100968940000016.GIF" wi="1709" he="284" />其中,Θ<sub>m</sub>是维数为N<sub>r</sub>×N的矩阵,σ<sub>mr</sub>(i,n)表示实部值,σ<sub>mi</sub>(i,n)表示虚部值,其中i=1,2,…,N<sub>r</sub>,n=1,2,…,N;散射系数记为σ<sub>m</sub>(i,n)=σ<sub>mr</sub>(i,n)+σ<sub>mi</sub>(i,n);步骤3、建立回波信号,导入电磁散射系数并利用三维BP算法成像:根据步骤1中阵列天线各阵元位置矢量<img file="FDA0001100968940000017.GIF" wi="75" he="69" />采用公式<img file="FDA0001100968940000018.GIF" wi="469" he="86" />n=1,2,…,N,m=1,2,…,M,计算得到在阵列三维SAR场景目标空间Ω中第m个点目标到第n个线阵天线阵元的距离,记为<img file="FDA0001100968940000021.GIF" wi="230" he="87" />其中||·||<sub>2</sub>表示向量L2范数,<img file="FDA0001100968940000022.GIF" wi="62" he="70" />为步骤1中初始化得到场景目标空间Ω中第m个点目标的坐标矢量,M为初始化的场景目标空间Ω中点目标总数;采用公式<img file="FDA0001100968940000023.GIF" wi="541" he="85" />n=1,2,…,N,m=1,2,…,M,计算得到阵列三维SAR场景目标空间Ω中第m个点目标到第n个线阵天线阵元的时间延时,记为τ(m,n),其中C为步骤1中初始化得到的光在空气中的传播速度;阵列三维SAR第n个线阵天线阵元的原始回波数据记为s(n),在阵列三维SAR实际观测中,s(n)可由数据接收机得到;若在仿真过程中,s(n)为场景目标空间Ω中所有单元格回波的总数,采用标准的合成孔径雷达原始回波仿真方法及电磁计算仿真方法产生得到,近似表示公式可以表示为<img file="FDA0001100968940000024.GIF" wi="949" he="127" />其中∑(·)表示求和运算符号,exp(·)表示e指数运算符号,f<sub>i</sub>为步骤1初始化得到的步进频率信号的子脉冲频率,σ<sub>m</sub>(i,n)为步骤二通过电磁仿真得到的场景目标空间Ω中第m个点目标的散射系数,j为虚数单位,即‑1的开根值,π为圆周率;步骤4、利用三维BP算法成像:采用标准的三维BP算法,对步骤3中得到的回波信号s(n)进行后向投影成像处理,得到目标空间Ω的一幅三维SAR图像;步骤5、构造三维SAR图像仿真样本库:对于步骤2中的经典电磁仿真软件FEKO中的K类不同的电磁仿真模型,重复步骤1到步骤4可以得到K幅不同模型的三维SAR图像。采用标准的深度置信网络样本库构造方法,利用上述得到的K幅三维SAR图像,构造总数为K<sub>tr</sub>的二维SAR图像的样本库,样本库中的二维SAR图像记为P<sub>ktr</sub>(X,Y),其中ktr=1,2,...,K<sub>tr</sub>,X、Y为图像的像素点坐标。步骤6、样本图像的预处理:采用标准的图像预处理方法,对步骤5中得到的样本库以及样本库中的图像进行处理。具体步骤如下:将第ktr幅训练样本库中的二维的SAR图像P<sub>ktr</sub>(X,Y)转换成反色图像<img file="FDA0001100968940000025.GIF" wi="229" he="76" />即:<maths num="0001"><math><![CDATA[<mrow><mover><msub><mi>P</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msub><mi>k</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>=</mo><mn>255</mn><mo>-</mo><msub><mi>P</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mrow><mo>(</mo><msub><mi>k</mi><mn>1</mn></msub><mo>)</mo></mrow><mo>,</mo><mi>k</mi><mi>t</mi><mi>r</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>K</mi><mrow><mi>t</mi><mi>r</mi></mrow></msub></mrow>]]></math><img file="FDA0001100968940000026.GIF" wi="806" he="78" /></maths>设置阈值记为thre,将灰度的反色图像P<sub>ktr</sub>(X,Y)转换为二值图像<img file="FDA0001100968940000031.GIF" wi="245" he="76" />其中ktr=1,2,…,K<sub>tr</sub>,即:<maths num="0002"><math><![CDATA[<mrow><mover><msub><mi>B</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>1</mn><mo>,</mo></mrow></mtd><mtd><mrow><mover><msub><mi>P</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><mn>255</mn><mo>&CenterDot;</mo><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi></mrow></mtd></mtr><mtr><mtd><mrow><mn>0</mn><mo>,</mo></mrow></mtd><mtd><mrow><mover><msub><mi>P</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>&lt;</mo><mn>255</mn><mo>&CenterDot;</mo><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001100968940000032.GIF" wi="878" he="173" /></maths>即将P<sub>ktr</sub>(X,Y)中灰度值超过255·thre的都变为1,灰度值低于255·thre的都变为0。查找<img file="FDA0001100968940000033.GIF" wi="219" he="76" />的灰度值为1的像素所包含的横纵坐标的范围,即图像中的目标区域,去除多余的白色区域,得到图像:<maths num="0003"><math><![CDATA[<mrow><mover><msub><mi>B</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><msup><mi>X</mi><mo>&prime;</mo></msup><mo>,</mo><msup><mi>Y</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>1</mn><mo>,</mo></mrow></mtd><mtd><mrow><mover><msub><mi>B</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mrow><mi>N</mi><mi>u</mi><mi>l</mi><mi>l</mi><mo>,</mo></mrow></mtd><mtd><mrow><mo>,</mo><mover><msub><mi>B</mi><mrow><mi>k</mi><mi>t</mi><mi>r</mi></mrow></msub><mo>&OverBar;</mo></mover><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mn>0</mn></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001100968940000034.GIF" wi="827" he="174" /></maths>其中X'、Y'为去除白色区域后目标图像的像素点坐标。将<img file="FDA0001100968940000035.GIF" wi="238" he="76" />转换为16×16的图像大小,图像预处理完成。步骤7、设置待优化深度置信网络参数的初始值:确定深度置信网络需要进行优化设置的参数,并给出每个参数在迭代过程中的最小值、最大值和迭代的步进大小:1)第一隐含层:第一隐含层大小的最小值记为C1<sub>min</sub>,第一隐含层大小的最大值记为C1<sub>max</sub>,第一隐含层步进大小记为C1<sub>step</sub>。2)第二隐藏层:第二隐含层大小的最小值记为C2<sub>min</sub>,第二隐含层大小的最大值记为C2<sub>max</sub>,第二隐含层步进大小记为C2<sub>step</sub>。3)深度置信网络的学习速率的大小:学习速率最小值记为α<sub>min</sub>,学习速率最大值记为α<sub>max</sub>,学习速率步进大小记为α<sub>step</sub>。4)深度置信网络的批量训练数据的大小:初始批量学习数据的大小的最小值记为b<sub>min</sub>,初始批量学习数据的大小的最大值记为b<sub>max</sub>,初始批量学习数据步进记为b<sub>step</sub>。5)深度置信网络的RBM迭代次数:RBM初始迭代次数的最小值记为rn<sub>min</sub>,RBM初始迭代次数的最大值记为rn<sub>max</sub>,RBM迭代次数步进大小记为rn<sub>step</sub>。所有参数的迭代同步进行,迭代次数记为steps。步骤8、采用交叉验证方法对参数进行自适应调优,并利用深度置信网络进行识别:按照步骤7中设置待优化深度置信网络的初始值后,采用交叉验证方法,将步骤5中构造的样本库中的K<sub>tr</sub>幅SAR图像数据平均分为W份,记为K<sub>1</sub>,K<sub>2</sub>,…,K<sub>W</sub>,其中将K<sub>1</sub>作为测试样本集,测试样本集大小为K<sub>tr</sub>/W,剩下W‑1份作为训练样本集,训练样本集的大小为(K<sub>tr</sub>·(W‑1))/W;采用经典的深度置信网络中的训练方法和测试样本集识别方法,进行训练并对测试样本集进行识别,得到一份测试样本集的识别正确率,记为A<sub>11</sub>;依次将K<sub>2</sub>,K<sub>3</sub>,…,K<sub>W</sub>更替作为测试样本集,并将剩下的W‑1份作为训练样本集,得到W份的测试样本集的识别正确率分别记为A<sub>11</sub>,A<sub>12</sub>,…,A<sub>1W</sub>。在步骤7中参数循环迭代下,重复上述过程,依次对这W份的样本集更替变换测试样本集,并将剩下的W‑1份作为训练样本集,并进行训练并对测试样本集进行识别,得到一共steps组,每组W份的测试样本集的识别正确率,记为A<sub>s1</sub>,A<sub>s2</sub>,…,A<sub>sW</sub>,s=1,2,…,steps;对每一组内的识别正确率求统计平均值,记为<img file="FDA0001100968940000041.GIF" wi="69" he="70" />s=1,2,…,steps,取最大值,即为最优化的深度置信网络参数设置,交叉验证的流程详见附图4。利用最优化后的深度置信网络进行识别,得到最优识别正确率,记为A<sub>max</sub>。整个深度置信网络的识别流程详见附图5。
地址 611731 四川省成都市高新区(西区)西源大道2006号