一种基于卷积神经网络的路面交通标志识别方法,申请号CN201610330600.3-传众专利搜索

发明名称	一种基于卷积神经网络的路面交通标志识别方法
摘要	本发明公开了一种基于卷积神经网络的路面交通标志识别方法，包括以下步骤：图像采集和预处理；卷积神经网络结构的设计及训练。本发明采用V‑视差法从原始图像中获取路面区域，能够降低非路面干扰造成的影响，使得提取路面区域的精度提高。本发明采用俯视图重构路面区域，将视觉图像里由于视角的原因，呈现出的不平行的线，重构为近似的平行线，更有利于路面交通标志的识别，提高了对视角倾斜的适应能力。本发明采用卷积神经网络这一深度学方法，能够从大量的训练样本中提取到反映数据本质的隐性特征。相比于浅层学分类器，它具有更高的学效率和识别精度。
申请公布号	CN105930830A	申请公布日期	2016.09.07
申请号	CN201610330600.3	申请日期	2016.05.18
申请人	大连理工大学	发明人	连静;李琳辉;矫翔;伦智梅;刘爽;孙延秋;范悟明
分类号	G06K9/00(2006.01)I;G06N3/02(2006.01)I	主分类号	G06K9/00(2006.01)I
代理机构	大连东方专利代理有限责任公司 21212	代理人	李洪福
主权项	一种基于卷积神经网络的路面交通标志识别方法，其特征在于：包括以下步骤：A、图像采集和预处理首先，通过安装在车辆前方的相机采集车辆行驶环境的RGB‑D图像，即包含颜色RGB信息的彩色图像和深度Depth信息的深度图像；其次，采用V‑视差法从深度图像中检测路面区域，将获取的路面区域作为路面交通标志识别的感兴趣区域；然后，通过计算得到相机的内部参数以及外部参数，对感兴趣区域进行俯视图重构；最后，从俯视图重构的路面区域中提取图像样本，即从图像左下角开始，在横向方向和纵向方向上，每间隔3个像素值，截取像素值大小为64×64的图像样本；B、卷积神经网络结构的设计及训练B1、卷积神经网络结构由9层组成，包括1个输入层、1个输出层、1个全连接层、6个隐含层，隐含层由3层卷积层和3层采样层交替组成；输入层的像素值大小为64×64的图像样本；输出层的神经元个数为5个，分别用于识别车道线、停止线、斑马线、行车方向箭头和限速数字；大小为64×64的图像样本经输入层进入卷积层C1中；卷积层C1有32个大小为56×56的特征图，特征图的每个神经元与输入层中的一个大小为9×9的局部感受野相连接，卷积层C1具有的可训练参数为2624个，连接数为8228864个；采样层S2有32个大小为28×28的特征图，特征图的每个神经元与卷积层C1中的一个大小为2×2的邻域相连，采样层S2具有的可训练参数为64个，连接数为50176个；卷积层C3有64个大小为20×20的特征图，特征图的每个神经元与采样层S2中的一个大小为9×9的局部感受野相连，卷积层C3具有的可训练参数为5248个，连接数为2099200个；采样层S4有64个大小为10×10的特征图，特征图的每个神经元与卷积层C3的一个大小为2×2的邻域相连接，采样层S4具有的可训练参数为128个，连接数为12800个；卷积层C5有96个大小为2×2的特征图，特征图的每个神经元与采样层S4的一个9×9的局部感受野相连，卷积层C5具有的可训练参数为7872个，连接数为31488个；采样层S6有96个大小为1×1的特征图，特征图的每个神经元与卷积层C5的一个大小为2×2的邻域相连接，采样层S6具有的可训练参数为192个，连接数为192个；全连接层F7与采样层S6进行全连接，全连接层F7具有1440个神经元，139680个可训练参数；输出层由径向基函数单元组成；卷积神经网络第l个卷积层中第j个神经元<img file="FDA0000993411690000023.GIF" wi="45" he="71" />表示为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>x</mi><mi>j</mi><mi>l</mi></msubsup><mo>=</mo><mi>f</mi><mrow><mo>(</mo><munder><mi>Σ</mi><mrow><mi>i</mi><mo>&Element;</mo><msub><mi>M</mi><mi>j</mi></msub></mrow></munder><msubsup><mi>x</mi><mi>i</mi><mrow><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>*</mo><msubsup><mi>w</mi><mrow><mi>i</mi><mi>j</mi></mrow><mi>l</mi></msubsup><mo>+</mo><msubsup><mi>b</mi><mi>j</mi><mi>l</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000993411690000021.GIF" wi="1797" he="115" /></maths>式中：f(·)表示卷积层的激活函数，<img file="FDA0000993411690000024.GIF" wi="69" he="71" />是当前层的输入神经元，w是卷积核，M<sub>j</sub>代表输入特征图的一个选择，b代表偏置；其中，上标l∈{1,3,5}表示层数索引号；下标i＝1,2,3,……，表示第l层的神经元索引号；下标j＝1,2,3,……，表示第l‑1层的神经元索引号；卷积神经网络第l个采样层中第j个神经元<img file="FDA0000993411690000025.GIF" wi="46" he="70" />表示为：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>x</mi><mi>j</mi><mi>l</mi></msubsup><mo>=</mo><mi>g</mi><mrow><mo>(</mo><msubsup><mi>β</mi><mi>j</mi><mi>l</mi></msubsup><mi>d</mi><mi>o</mi><mi>w</mi><mi>n</mi><mo>(</mo><msubsup><mi>x</mi><mi>i</mi><mrow><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo><mo>+</mo><msubsup><mi>k</mi><mi>j</mi><mi>l</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000993411690000022.GIF" wi="1806" he="71" /></maths>式中：g(·)表示采样层的激活函数，β表示采样层的权值，down(·)代表采样函数，是对前一层图像的一个方形的区域求和，<img file="FDA0000993411690000026.GIF" wi="76" he="68" />是当前层的输入神经元，k代表偏置；其中，上标l∈{2,4,6}表示层数索引号；下标i＝1,2,3,……，表示第l‑1层的神经元索引号；下标j＝1,2,3,……，表示第l层的神经元索引号；激活函数采用线性修正激活函数ReLU，其具体形式为：f＝max(0；x)，其能够使卷积神经网络的训练速度加快，并且能够较好的传递误差梯度；B2、根据实际应用环境，将上述卷积神经网络的输出神经元的个数设定为5个，分别用于识别车道线、停止线、斑马线、行车方向箭头和限速数字；然后采用步骤A获得的图像样本进行训练；卷积神经网络采用离线训练的方式，卷积神经网络训练的样本集为10000张像素值大小为64×64的图像样本，且保证不同类别的样本数目相同；卷积神经网络初始权值的选取采用随机法产生；当卷积神经网络的输出值与期望值的误差在可接受范围内时，便得到用于路面交通标志识别的卷积神经网络。
地址	116024 辽宁省大连市高新园区凌工路2号