发明名称 一种基于卷积神经网络的路面交通标志识别方法
摘要 本发明公开了一种基于卷积神经网络的路面交通标志识别方法,包括以下步骤:图像采集和预处理;卷积神经网络结构的设计及训练。本发明采用V‑视差法从原始图像中获取路面区域,能够降低非路面干扰造成的影响,使得提取路面区域的精度提高。本发明采用俯视图重构路面区域,将视觉图像里由于视角的原因,呈现出的不平行的线,重构为近似的平行线,更有利于路面交通标志的识别,提高了对视角倾斜的适应能力。本发明采用卷积神经网络这一深度学方法,能够从大量的训练样本中提取到反映数据本质的隐性特征。相比于浅层学分类器,它具有更高的学效率和识别精度。
申请公布号 CN105930830A 申请公布日期 2016.09.07
申请号 CN201610330600.3 申请日期 2016.05.18
申请人 大连理工大学 发明人 连静;李琳辉;矫翔;伦智梅;刘爽;孙延秋;范悟明
分类号 G06K9/00(2006.01)I;G06N3/02(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 大连东方专利代理有限责任公司 21212 代理人 李洪福
主权项 一种基于卷积神经网络的路面交通标志识别方法,其特征在于:包括以下步骤:A、图像采集和预处理首先,通过安装在车辆前方的相机采集车辆行驶环境的RGB‑D图像,即包含颜色RGB信息的彩色图像和深度Depth信息的深度图像;其次,采用V‑视差法从深度图像中检测路面区域,将获取的路面区域作为路面交通标志识别的感兴趣区域;然后,通过计算得到相机的内部参数以及外部参数,对感兴趣区域进行俯视图重构;最后,从俯视图重构的路面区域中提取图像样本,即从图像左下角开始,在横向方向和纵向方向上,每间隔3个像素值,截取像素值大小为64×64的图像样本;B、卷积神经网络结构的设计及训练B1、卷积神经网络结构由9层组成,包括1个输入层、1个输出层、1个全连接层、6个隐含层,隐含层由3层卷积层和3层采样层交替组成;输入层的像素值大小为64×64的图像样本;输出层的神经元个数为5个,分别用于识别车道线、停止线、斑马线、行车方向箭头和限速数字;大小为64×64的图像样本经输入层进入卷积层C1中;卷积层C1有32个大小为56×56的特征图,特征图的每个神经元与输入层中的一个大小为9×9的局部感受野相连接,卷积层C1具有的可训练参数为2624个,连接数为8228864个;采样层S2有32个大小为28×28的特征图,特征图的每个神经元与卷积层C1中的一个大小为2×2的邻域相连,采样层S2具有的可训练参数为64个,连接数为50176个;卷积层C3有64个大小为20×20的特征图,特征图的每个神经元与采样层S2中的一个大小为9×9的局部感受野相连,卷积层C3具有的可训练参数为5248个,连接数为2099200个;采样层S4有64个大小为10×10的特征图,特征图的每个神经元与卷积层C3的一个大小为2×2的邻域相连接,采样层S4具有的可训练参数为128个,连接数为12800个;卷积层C5有96个大小为2×2的特征图,特征图的每个神经元与采样层S4的一个9×9的局部感受野相连,卷积层C5具有的可训练参数为7872个,连接数为31488个;采样层S6有96个大小为1×1的特征图,特征图的每个神经元与卷积层C5的一个大小为2×2的邻域相连接,采样层S6具有的可训练参数为192个,连接数为192个;全连接层F7与采样层S6进行全连接,全连接层F7具有1440个神经元,139680个可训练参数;输出层由径向基函数单元组成;卷积神经网络第l个卷积层中第j个神经元<img file="FDA0000993411690000023.GIF" wi="45" he="71" />表示为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>x</mi><mi>j</mi><mi>l</mi></msubsup><mo>=</mo><mi>f</mi><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&Element;</mo><msub><mi>M</mi><mi>j</mi></msub></mrow></munder><msubsup><mi>x</mi><mi>i</mi><mrow><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>*</mo><msubsup><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow><mi>l</mi></msubsup><mo>+</mo><msubsup><mi>b</mi><mi>j</mi><mi>l</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000993411690000021.GIF" wi="1797" he="115" /></maths>式中:f(·)表示卷积层的激活函数,<img file="FDA0000993411690000024.GIF" wi="69" he="71" />是当前层的输入神经元,w是卷积核,M<sub>j</sub>代表输入特征图的一个选择,b代表偏置;其中,上标l∈{1,3,5}表示层数索引号;下标i=1,2,3,……,表示第l层的神经元索引号;下标j=1,2,3,……,表示第l‑1层的神经元索引号;卷积神经网络第l个采样层中第j个神经元<img file="FDA0000993411690000025.GIF" wi="46" he="70" />表示为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>x</mi><mi>j</mi><mi>l</mi></msubsup><mo>=</mo><mi>g</mi><mrow><mo>(</mo><msubsup><mi>&beta;</mi><mi>j</mi><mi>l</mi></msubsup><mi>d</mi><mi>o</mi><mi>w</mi><mi>n</mi><mo>(</mo><msubsup><mi>x</mi><mi>i</mi><mrow><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo><mo>+</mo><msubsup><mi>k</mi><mi>j</mi><mi>l</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000993411690000022.GIF" wi="1806" he="71" /></maths>式中:g(·)表示采样层的激活函数,β表示采样层的权值,down(·)代表采样函数,是对前一层图像的一个方形的区域求和,<img file="FDA0000993411690000026.GIF" wi="76" he="68" />是当前层的输入神经元,k代表偏置;其中,上标l∈{2,4,6}表示层数索引号;下标i=1,2,3,……,表示第l‑1层的神经元索引号;下标j=1,2,3,……,表示第l层的神经元索引号;激活函数采用线性修正激活函数ReLU,其具体形式为:f=max(0;x),其能够使卷积神经网络的训练速度加快,并且能够较好的传递误差梯度;B2、根据实际应用环境,将上述卷积神经网络的输出神经元的个数设定为5个,分别用于识别车道线、停止线、斑马线、行车方向箭头和限速数字;然后采用步骤A获得的图像样本进行训练;卷积神经网络采用离线训练的方式,卷积神经网络训练的样本集为10000张像素值大小为64×64的图像样本,且保证不同类别的样本数目相同;卷积神经网络初始权值的选取采用随机法产生;当卷积神经网络的输出值与期望值的误差在可接受范围内时,便得到用于路面交通标志识别的卷积神经网络。
地址 116024 辽宁省大连市高新园区凌工路2号