发明名称 一种融合雷达和CCD摄像机信号的车辆检测方法
摘要 本发明公开了一种融合雷达和CCD摄像机信号的车辆检测方法,包括:输入雷达和CCD摄像机信号;进行摄像头校正,得到路平面坐标与图像坐标的投影矩阵,将路平面世界坐标转换成图像平面坐标;建立适合车辆HOG描述器的正负样本集;对车辆样本集进行批量特征提取,建立HOG样本集;建立线性支持向量机SVM分类模型,对SVM进行训练;提取雷达检测到的障碍物在视频图像中的感兴趣区域,输入SVM分类器中进行目标类型判断;输出识别结果;利用雷达测出判断为车辆的目标的距离。本发明利用雷达和CCD摄像机信号进行联合检测,不仅获取了车辆的深度信息,同时也能较好地检测出车辆的轮廓信息,提高了车辆检测、定位的可靠性和精确性。
申请公布号 CN103559791A 申请公布日期 2014.02.05
申请号 CN201310530503.5 申请日期 2013.10.31
申请人 北京联合大学 发明人 鲍泓;徐成;田仙仙;张璐璐
分类号 G08G1/01(2006.01)I;G08G1/04(2006.01)I;G06K9/62(2006.01)I 主分类号 G08G1/01(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 吴荫芳
主权项 1.一种融合雷达和CCD摄像机信号的车辆检测方法,其特征在于包括以下步骤:步骤一,输入来自雷达的路面障碍物信息信号和来自CCD摄像机的路平面图像信号;步骤二,进行包括照相机的内参和外参的摄像头校正,得到路平面坐标与图像坐标的投影矩阵,将路平面世界坐标转换成图像平面坐标;世界坐标系中的点到图像坐标中的点的投影过程分两步来实现:(1)将世界坐标系(或参考坐标系)中点的坐标(X<sub>w</sub>,Y<sub>w</sub>,Z<sub>w</sub>)变换到照相机坐标系(X<sub>c</sub>,Y<sub>c</sub>,Z<sub>c</sub>),变换公式为:<maths num="0001"><![CDATA[<math><mrow><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>X</mi><mi>C</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Y</mi><mi>C</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Z</mi><mi>C</mi></msub></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>r</mi><mn>11</mn></msub></mtd><mtd><msub><mi>r</mi><mn>12</mn></msub></mtd><mtd><msub><mi>r</mi><mn>13</mn></msub></mtd><mtd><msub><mi>t</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>21</mn></msub></mtd><mtd><msub><mi>r</mi><mn>22</mn></msub></mtd><mtd><msub><mi>r</mi><mn>23</mn></msub></mtd><mtd><msub><mi>t</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>31</mn></msub></mtd><mtd><msub><mi>r</mi><mn>32</mn></msub></mtd><mtd><msub><mi>r</mi><mn>32</mn></msub></mtd><mtd><msub><mi>t</mi><mn>3</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>X</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Y</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Z</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>式中,<maths num="0002"><![CDATA[<math><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>r</mi><mn>11</mn></msub></mtd><mtd><msub><mi>r</mi><mn>12</mn></msub></mtd><mtd><msub><mi>r</mi><mn>13</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>21</mn></msub></mtd><mtd><msub><mi>r</mi><mn>22</mn></msub></mtd><mtd><msub><mi>r</mi><mn>23</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>31</mn></msub></mtd><mtd><msub><mi>r</mi><mn>32</mn></msub></mtd><mtd><msub><mi>r</mi><mn>33</mn></msub></mtd></mtr></mtable></mfenced></math>]]></maths>为由世界坐标系到照相机坐标系的旋转矩阵,<maths num="0003"><![CDATA[<math><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>t</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>t</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>t</mi><mn>3</mn></msub></mtd></mtr></mtable></mfenced></math>]]></maths>为由世界坐标系到照相机坐标系的平移矩阵;(2)由照相机坐标系变换到图像坐标系,变换公式为:<maths num="0004"><![CDATA[<math><mrow><mi>s</mi><mfenced open='[' close=']'><mtable><mtr><mtd><mi>x</mi></mtd></mtr><mtr><mtd><mi>y</mi></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>f</mi><mi>x</mi></msub></mtd><mtd><mn>0</mn></mtd><mtd><msub><mi>u</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><msub><mi>f</mi><mi>y</mi></msub></mtd><mtd><msub><mi>v</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>X</mi><mi>C</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Y</mi><mi>C</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Z</mi><mi>C</mi></msub></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>式中,f<sub>x</sub>、f<sub>y</sub>代表以像素为单位的水平方向和垂直方向焦距,u<sub>0</sub>、v<sub>0</sub>分别表示摄像机主轴与图像平面的交点的横、纵坐标,s为投影参数;世界坐标系中的点到图像坐标中的点的投影公式为:<maths num="0005"><![CDATA[<math><mrow><mi>s</mi><mfenced open='[' close=']'><mtable><mtr><mtd><mi>x</mi></mtd></mtr><mtr><mtd><mi>y</mi></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>f</mi><mi>x</mi></msub></mtd><mtd><mn>0</mn></mtd><mtd><msub><mi>u</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><msub><mi>f</mi><mi>y</mi></msub></mtd><mtd><msub><mi>v</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>r</mi><mn>11</mn></msub></mtd><mtd><msub><mi>r</mi><mn>12</mn></msub></mtd><mtd><msub><mi>r</mi><mn>13</mn></msub></mtd><mtd><msub><mi>t</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>21</mn></msub></mtd><mtd><msub><mi>r</mi><mn>22</mn></msub></mtd><mtd><msub><mi>r</mi><mn>23</mn></msub></mtd><mtd><msub><mi>t</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>r</mi><mn>31</mn></msub></mtd><mtd><msub><mi>r</mi><mn>32</mn></msub></mtd><mtd><msub><mi>r</mi><mn>33</mn></msub></mtd><mtd><msub><mi>t</mi><mn>3</mn></msub></mtd></mtr></mtable></mfenced><mfenced open='[' close=']'><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>X</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Y</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><msub><mi>Z</mi><mi>W</mi></msub></mtd></mtr><mtr><mtd><mn>1</mn></mtd></mtr></mtable></mfenced></mfenced></mrow></math>]]></maths>选择棋盘格中定义的坐标系作为参考坐标系,每个视角都建立相应的刚体变换,通过给定照相机内参数,得到求解过程的初始值,使求得的照相机的内参尽量使重投影误差最小;在标定出相机的内参数时,最后选择地平面上的一张标定板的图片的棋盘格坐标系作为参考坐标系;通过将雷达所在路平面坐标系与选定的标定板的坐标系之间进行变换,得到雷达监测到的路平面的车辆坐标与图像坐标的转换矩阵、车辆高度与图像坐标的转换矩阵,从而可以确定出车辆在图像平面上的位置及所在位置的车辆的高度;步骤三,建立适合车辆HOG特征描述器的正负样本集;步骤四,采用HOG算法对车辆样本集进行批量特征提取,从而建立HOG特征样本集;HOG特征是针对矩形区域中的梯度方向上的强度统计;采用行人模板大小为64*128,将行人模板样本分为16*16大小的block块,设block的高为H,宽为W,本发明采用H:W=1:1块特征提取方法:每个block块分为4个相同的cell单元,每个cell单元的大小为8*8,每个单元的特征是其内部64个像素的特征向量之和;用I(x,y)表示图像I在(x,y)处像素点的灰度值,按下式计算矩形区域中的梯度方向的强度统计特征:G<sub>x</sub>(x,y)=I(x+1,y)-I(x-1,y)G<sub>y</sub>(x,y)=I(x,y+1)-I(x,y-1)<maths num="0006"><![CDATA[<math><mrow><mi>G</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><msqrt><msub><msup><mi>G</mi><mn>2</mn></msup><mi>x</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>+</mo><msub><msup><mi>G</mi><mn>2</mn></msup><mi>y</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow></msqrt></mrow></math>]]></maths>α(x,y)=arctan(G<sub>y</sub>(x,y),G<sub>x</sub>(x,y))其中,G<sub>x</sub>(x,y)、G<sub>y</sub>(x,y)分别表示(x,y)处像素点的水平方向和垂直方向的梯度幅值,G(x,y)为(x,y)处像素点的梯度强度,α(x,y)表示(x,y)处像素点的梯度方向;HOG特征将<img file="FDA0000405944160000022.GIF" wi="188" he="145" />的梯度方向均匀分为9个bin(区间),第k个方向的梯度幅值大小A<sub>k</sub>(x,y)为:<maths num="0007"><![CDATA[<math><mrow><msub><mi>A</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>G</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mi>&alpha;</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>bin</mi><mi>k</mi></msub></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo></mtd><mtd><mi>others</mi></mtd></mtr></mtable></mfenced><mo>,</mo><mn>1</mn><mo>&le;</mo><mi>k</mi><mo>&le;</mo><mn>9</mn></mrow></math>]]></maths>其中,bin<sub>k</sub>(x,y)表示梯度方向的第k个方向区间;这样,(x,y)处像素点的每个方向上的梯度特征可以用一个9维的向量A<sub>k</sub>(x,y)表示;为了消除光照等因素影响,对块内的每个单元进行归一化处理:<maths num="0008"><![CDATA[<math><mrow><mi>f</mi><mrow><mo>(</mo><msub><mi>c</mi><mi>m</mi></msub><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>c</mi><mi>m</mi></msub></mrow></msub><msub><mi>A</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>+</mo><mi>&epsiv;</mi></mrow><mrow><msub><mi>&Sigma;</mi><mrow><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>&Element;</mo><mi>B</mi></mrow></msub><msub><mi>A</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>+</mo><mi>&epsiv;</mi></mrow></mfrac><mo>,</mo><mi>m</mi><mo>=</mo><mn>1,2,3,4</mn></mrow></math>]]></maths>其中,f(c<sub>m</sub>,k)表示第m个单元c<sub>m</sub>中的第k个区间的归一化强度,ε是为了避免分母为零设置的一个较小的数;由f(c<sub>m</sub>,k)的表达式可知,每个单元提取的特征向量为9维,每个块的特征为将4个cell单元中的特征级联得到的36维向量;步骤五,建立线性SVM分类器,使用步骤四中的特征样本集训练SVM分类器;步骤六,目标类型判断;将雷达得到的车辆在路平面中的位置信息通过矩阵变换转换成图像坐标信息,将感兴趣区域图像进行特征提取,采用步骤五训练得到的SVM分类器进行预测,判断目标是否是车辆;步骤七,输出SVM分类器的目标物体识别结果;步骤八,利用单线激光雷达测出智能车前方判断为车辆的目标的距离。
地址 100101 北京市朝阳区北四环东路97号