基于级联微神经网络的物体识别方法,申请号CN201610185644.1-传众专利搜索

发明名称	基于级联微神经网络的物体识别方法
摘要	本发明涉及一种基于级联微神经网络的物体识别方法，步骤如下：根据输入样本图像的尺寸计算深度神经网络中级联卷积层的数目；构建深度级联微神经网络；设定该深度级联微神经网络的训练参数，采用随机梯度下降法进行训练；采用softmax分类器进行分类，并利用前向传播算法计算分类误差；利用反向传播运算更新神经网络中需要训练的参数的权重值；得到深度级联微神经网络，该级联微神经网络可以高效地识别出相应类别的物体。本发明可以在不增加参数(运算复杂度)的情况下提高物体识别系统的识别性能。同时，本方法简单，容易收敛，不会增加训练时间。
申请公布号	CN105894012A	申请公布日期	2016.08.24
申请号	CN201610185644.1	申请日期	2016.03.29
申请人	天津大学	发明人	庞彦伟;姜晓恒
分类号	G06K9/62(2006.01)I;G06N3/08(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	天津市北洋有限责任专利代理事务所 12201	代理人	程毓英
主权项	一种基于级联微神经网络的物体识别方法，该方法采用深度神经网络进行物体识别，其基本运算单元由级联子块滤波器f<sub>l</sub>组成，级联子块滤波器f<sub>l</sub>中的第i个子块滤波器w<sub>i,k</sub>由两个基本滤波器<img file="FDA0000952681480000011.GIF" wi="66" he="63" />和<img file="FDA0000952681480000012.GIF" wi="68" he="70" />组成，表示为<img file="FDA0000952681480000013.GIF" wi="320" he="79" />k指示输出的特征通道索引，<img file="FDA0000952681480000014.GIF" wi="70" he="62" />称为空间滤波器，大小为h<sub>i</sub>×w<sub>i</sub>,且满足h<sub>i</sub>＜H和w<sub>i</sub>＜W，h<sub>i</sub>和w<sub>i</sub>分别为该空间滤波器的高度和宽度，H和W为输入的局部图像块的高度和宽度，用于提取输入局部图像块中子块的空间特征；<img file="FDA0000952681480000015.GIF" wi="78" he="62" />称为通道滤波器，大小为1×1，用于加强输出通道特征之间的联系，第i个子块滤波器w<sub>i,k</sub>的大小表示为(h<sub>i</sub>×w<sub>i</sub>,1×1)，级联子块滤波器f<sub>l</sub>由n个子块滤波器级联组成，表示为f<sub>l</sub>＝[(h<sub>1</sub>×w<sub>1</sub>,1×1),(h<sub>2</sub>×w<sub>2</sub>,1×1),...(h<sub>n</sub>×w<sub>n</sub>,1×1))],l表示级联子块滤波器在深度神经网络中所处的层数；级联子块滤波器f<sub>l</sub>与大小为H×W的局部图像块满足<img file="FDA0000952681480000016.GIF" wi="299" he="103" />和<img file="FDA0000952681480000017.GIF" wi="620" he="103" />的约束，级联子块滤波器f<sub>l</sub>与输入通道特征卷积得到级联卷积层，表示为C<sub>l</sub>。所述的物体识别方法的步骤如下：步骤1：根据输入样本图像的尺寸H<sub>I</sub>和W<sub>I</sub>，H<sub>I</sub>表示高度，W<sub>I</sub>表示宽度，计算出深度神经网络中级联卷积层的数目L，其中L为满足2<sup>L</sup>×5≥H<sub>I</sub>,2<sup>L</sup>×5≥W<sub>I</sub>的最小整数值；步骤2：根据每个级联卷积层C<sub>l</sub>所处理的局部图像块的大小H×W构建级联滤波器f<sub>l</sub>，对得到的级联卷积层C<sub>l</sub>进行0.5倍的降采样操作，连接所有L个级联卷积层C<sub>l</sub>构建一个深度级联微神经网络；步骤3：设定该深度级联微神经网络的训练参数，采用随机梯度下降法进行训练；步骤4：采用softmax分类器进行分类，并利用前向传播算法计算分类误差；步骤5：利用反向传播运算更新神经网络中需要训练的参数的权重值；步骤6：重复步骤4至步骤5，直至验证误差不再变化为止，此时训练过程结束，得到一个深度级联微神经网络，该级联微神经网络可以高效地识别出相应类别的物体。
地址	300072 天津市南开区卫津路92号