发明名称 一种基于双模态数据融合的道路检测方法
摘要 本发明公开了一种基于双模态数据融合的道路检测方法。包括如下步骤:激光雷达三维点的坐标系转换;获取落在摄像机图像范围内的激光雷达三维点集合;设定高度阈值,获取障碍物激光雷达三维点的子集;获取可通行道路区域激光雷达三维点的子集;获取非路区域和可通行道路区域的颜色混合高斯模型;获取图像上道路检测的感兴趣区域;构建基于马尔科夫随机场能量函数,求解能量函数最小值,获得全局最优图像道路检测结果。本发明实现了对复杂环境的鲁棒;检测结果不受道路表面阴影影响;能将传感器感知环境中细小的障碍物与可通行道路路区域区分;能对激光雷达无数据返回的区域与非路的判断;它适用于自主车辆导航等领域。
申请公布号 CN103198302A 申请公布日期 2013.07.10
申请号 CN201310124199.4 申请日期 2013.04.10
申请人 浙江大学 发明人 黄文琦;龚小谨;刘济林
分类号 G06K9/00(2006.01)I;G06T7/00(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 林怀禹
主权项 1.一种基于双模态数据融合的道路检测方法,其特征在于,包括如下步骤:1.1)激光雷达三维点的坐标系转换:将激光雷达三维坐标系,包括x轴,y轴和z轴下的激光雷达三维点X<sub>L</sub>=(x<sub>l</sub>,y<sub>l</sub>,z<sub>l</sub>)<sup>T</sup>通过左乘激光雷达与摄像机之间的旋转平移矩阵[R<sub>LC</sub> t<sub>LC</sub>]转换为摄像机三维坐标系下的激光雷达三维点X<sub>C</sub>=(x<sub>c</sub>,y<sub>c</sub>,z<sub>c</sub>)<sup>T</sup>,其中R<sub>LC</sub>表示激光雷达坐标系与摄像机坐标系之间的旋转矩阵,t<sub>LC</sub>表示激光雷达坐标系与摄像机坐标系之间的平移量,(x<sub>l</sub>,y<sub>l</sub>,z<sub>l</sub>)和(x<sub>c</sub>,y<sub>c</sub>,z<sub>c</sub>)分别表示激光雷达坐标系下和摄像机坐标系下激光雷达三维点的坐标值,该坐标系转换公式(1)如下,其中<img file="FDA00003031872700011.GIF" wi="66" he="75" />和<img file="FDA00003031872700012.GIF" wi="64" he="79" />分别表示X<sub>C</sub>和X<sub>L</sub>的其次坐标(x<sub>c</sub>,y<sub>c</sub>,z<sub>c</sub>,1)<sup>T</sup>和(x<sub>l</sub>,y<sub>l</sub>,z<sub>l</sub>,1)<sup>T</sup>,<maths num="0001"><![CDATA[<math><mrow><msub><mover><mi>X</mi><mo>~</mo></mover><mi>C</mi></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>R</mi><mi>LC</mi></msub></mtd><mtd><msub><mi>t</mi><mi>LC</mi></msub></mtd></mtr></mtable></mfenced><msub><mover><mi>X</mi><mo>~</mo></mover><mi>L</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>1.2)获取落在摄像机图像范围内的激光雷达三维点集合Γ:通过摄像机的内外参矩阵K,将摄像机三维坐标系下的激光雷达三维点X<sub>C</sub>投影为摄像机拍摄二维图像的坐标系,u轴,即图像横轴和v轴,即图像纵轴下的激光雷达二维点X<sub>I</sub>=(u<sub>I</sub>,v<sub>I</sub>)<sup>T</sup>,(u<sub>I</sub>,v<sub>I</sub>)表示二维图像的坐标系下激光雷达二维点的坐标值,摄像机投影公式(2)如下,其中<img file="FDA00003031872700014.GIF" wi="56" he="76" />表示X<sub>I</sub>的其次坐标(u<sub>I</sub>,v<sub>I</sub>,1)<sup>T</sup>,<maths num="0002"><![CDATA[<math><mrow><msub><mover><mi>X</mi><mo>~</mo></mover><mi>I</mi></msub><mo>=</mo><mi>K</mi><msub><mover><mi>X</mi><mo>~</mo></mover><mi>C</mi></msub><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>选取激光雷达二维点X<sub>I</sub>中在图像长I<sub>L</sub>宽I<sub>W</sub>范围内的二维点对应的激光雷达坐标系下的激光雷达三维点,记为X<sub>L</sub>'=(x<sub>l</sub>',y<sub>l</sub>',z<sub>l</sub>')<sup>T</sup>,作为集合Γ;1.3)获取障碍物激光雷达三维点的子集Γ<sub>O</sub>,并拟合道路所在的地平面:根据激光雷达安装的高度,设定高度阈值h,令激光雷达三维点集合Γ中z坐标在阈值h以上的点作为激光雷达检测到障碍物点的子集,记为Γ<sub>O</sub>,令激光雷达三维点集合Γ中z坐标在阈值h以下的点,记为Γ/Γ<sub>O</sub>,用于RANSAC平面拟合算法,拟合得到的平面即为道路所在地平面,该拟合的地平面参数记为π=(a,b,c,d)<sup>T</sup>,RANSAC平面拟合算法得到的内点集合记为<img file="FDA00003031872700016.GIF" wi="748" he="97" />其中<img file="FDA00003031872700017.GIF" wi="397" he="97" />为X<sub>L</sub>'的其次坐标,<img file="FDA00003031872700018.GIF" wi="44" he="60" />为设定的距离阈值;1.4)获取可通行道路区域激光雷达三维点的子集Γ<sub>R</sub>:RANSAC平面拟合算法得到的内点集合Γ<sub>G</sub>中包含了所有离平面π=(a,b,c,d)<sup>T</sup>距离小于<img file="FDA00003031872700019.GIF" wi="50" he="58" />的激光雷达三维点,但这些点中不仅包含可通行道路区域中的点,而且包含与道路平面垂直高度距离小于<img file="FDA000030318727000110.GIF" wi="46" he="62" />的绿化带上的点,为了将可通行道路区域与绿化带区分,需要运用激光雷达射线对含叶绿素的植物反射率强的性质,通过k-means聚类算法对路面上的激光雷达点进行两类的聚类,其中反射率均值较低的一类激光雷达三维点作为可通行道路区域激光雷达三维点的子集,记为Γ<sub>R</sub>;1.5)分别获取非路区域和可通行道路区域的颜色混合高斯模型Θ<sub>B</sub>和Θ<sub>R</sub>:分别用激光雷达三维点集Γ<sub>O</sub>和Γ<sub>R</sub>对应的图像上激光雷达二维点X<sub>I</sub>坐标值上的图像像素点颜色信息对非路区域和可通行道路区域进行混合高斯模型估计,得到估计的非路区域和可通行道路区域的颜色模型分别用Θ<sub>B</sub>和Θ<sub>R</sub>表示;1.6)获取图像上道路检测的感兴趣区域ROI:通过摄像机坐标系下拟合的地平面参数π=(a,b,c,d)<sup>T</sup>,定义摄像机坐标系下地平面无穷远处三维点X<sub>∞</sub>为<img file="FDA00003031872700021.GIF" wi="578" he="92" />再通过摄像机的内外参矩阵K,得到摄像机坐标系下地平面穷远点对应的图像地平线上的点X<sub>H</sub>=(u<sub>H</sub>,v<sub>H</sub>)<sup>T</sup>,如公式(3)所示,其中<img file="FDA00003031872700022.GIF" wi="349" he="91" />为X<sub>H</sub>的其次坐标,<maths num="0003"><![CDATA[<math><mrow><msub><mover><mi>X</mi><mo>~</mo></mover><mi>H</mi></msub><mo>=</mo><mi>K</mi><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>R</mi><mi>LG</mi></msub></mtd><mtd><msub><mi>t</mi><mi>LG</mi></msub></mtd></mtr></mtable></mfenced><msub><mover><mi>X</mi><mo>~</mo></mover><mo>&infin;</mo></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>然后将Κ个图像地平线上的点X<sub>H</sub>通过最小二乘算法拟合地平线H=(α<sub>0</sub>,-1,α<sub>1</sub>),其中α<sub>0</sub>和α<sub>1</sub>为直线参数,使地平线上的点满足v<sub>H</sub>=α<sub>0</sub>u<sub>H</sub>+α<sub>1</sub>,并设定图像地平线H以下为图像上道路检测感兴趣区域ROI;1.7)马尔科夫随机场能量函数初始设计:利用马尔科夫随机场原理,将图像感兴趣区域ROI内的道路检测全局最优问题转化为解马尔科夫随机场的能量最小问题,该能量函数初始设计Ε(L,F,Θ)如公式(4)所示,Ε(L,F,Θ)=λΕ<sub>Smooth</sub>(L,F)+Ε<sub>Data</sub>(L,F,Θ)    (4)其中,L={l<sub>i</sub>|i∈ROI}表示图像感兴趣区域ROI内第i个像素点对应标记l<sub>i</sub>的集合,l<sub>i</sub>的取值0和1分别表示第i个像素点的标记为“非路”和“可通行道路”,F={f<sub>i</sub>|i∈ROI}表示图像感兴趣区域ROI内第i个像素点对应特征f<sub>i</sub>的集合,在本方法中选取图像像素点的RGB值作为该像素点的特征,即f<sub>i</sub>=(R<sub>i</sub>,G<sub>i</sub>,B<sub>i</sub>),(R<sub>i</sub>,G<sub>i</sub>,B<sub>i</sub>)表示第i个像素点的R,G,B三个颜色通道的值,Θ={Θ<sub>B</sub>,Θ<sub>R</sub>}表示经计算得到的非路与可通行道路的先验概率模型,Ε<sub>Smooth</sub>和Ε<sub>Data</sub>分别是该能量函数的平滑项和数据项,λ是调节平滑项和数据项的权重参数;1.8)马尔科夫随机场能量函数最终设计:通过考虑激光雷达点提供的信息,在最终设计的能量函数中将在激光雷达三维点中获得的障碍物子集Γ<sub>O</sub>和可通行道路区域子集Γ<sub>R</sub>对应的图像像素点作为已知的部分分割结果,新的能量函数设计如公式(5)所示Ε(L,F,Θ,S)=λΕ<sub>Smooth</sub>(L,F)+Ε<sub>Data</sub>(L,F,Θ,S)    (5)其中,与公式(4)不同在于,增加了变量S用于表示图像感兴趣区域ROI内的像素点对应的激光雷达三维点障碍物子集Γ<sub>O</sub>和可通行道路区域子集Γ<sub>R</sub>;1.9)求解能量函数最小值,获得全局最优图像道路检测结果:通过图割方法对公式(5)所示能量函数进行最小值求解,公式(5)所示能量函数的最小值对应的L的取值,即为图像感兴趣区域ROI内全局最优的可通行区域道路检测结果。
地址 310027 浙江省杭州市西湖区浙大路38号