主权项 |
一种基于级联微神经网络的物体识别方法,该方法采用深度神经网络进行物体识别,其基本运算单元由级联子块滤波器f<sub>l</sub>组成,级联子块滤波器f<sub>l</sub>中的第i个子块滤波器w<sub>i,k</sub>由两个基本滤波器<img file="FDA0000952681480000011.GIF" wi="66" he="63" />和<img file="FDA0000952681480000012.GIF" wi="68" he="70" />组成,表示为<img file="FDA0000952681480000013.GIF" wi="320" he="79" />k指示输出的特征通道索引,<img file="FDA0000952681480000014.GIF" wi="70" he="62" />称为空间滤波器,大小为h<sub>i</sub>×w<sub>i</sub>,且满足h<sub>i</sub><H和w<sub>i</sub><W,h<sub>i</sub>和w<sub>i</sub>分别为该空间滤波器的高度和宽度,H和W为输入的局部图像块的高度和宽度,用于提取输入局部图像块中子块的空间特征;<img file="FDA0000952681480000015.GIF" wi="78" he="62" />称为通道滤波器,大小为1×1,用于加强输出通道特征之间的联系,第i个子块滤波器w<sub>i,k</sub>的大小表示为(h<sub>i</sub>×w<sub>i</sub>,1×1),级联子块滤波器f<sub>l</sub>由n个子块滤波器级联组成,表示为f<sub>l</sub>=[(h<sub>1</sub>×w<sub>1</sub>,1×1),(h<sub>2</sub>×w<sub>2</sub>,1×1),...(h<sub>n</sub>×w<sub>n</sub>,1×1))],l表示级联子块滤波器在深度神经网络中所处的层数;级联子块滤波器f<sub>l</sub>与大小为H×W的局部图像块满足<img file="FDA0000952681480000016.GIF" wi="299" he="103" />和<img file="FDA0000952681480000017.GIF" wi="620" he="103" />的约束,级联子块滤波器f<sub>l</sub>与输入通道特征卷积得到级联卷积层,表示为C<sub>l</sub>。所述的物体识别方法的步骤如下:步骤1:根据输入样本图像的尺寸H<sub>I</sub>和W<sub>I</sub>,H<sub>I</sub>表示高度,W<sub>I</sub>表示宽度,计算出深度神经网络中级联卷积层的数目L,其中L为满足2<sup>L</sup>×5≥H<sub>I</sub>,2<sup>L</sup>×5≥W<sub>I</sub>的最小整数值;步骤2:根据每个级联卷积层C<sub>l</sub>所处理的局部图像块的大小H×W构建级联滤波器f<sub>l</sub>,对得到的级联卷积层C<sub>l</sub>进行0.5倍的降采样操作,连接所有L个级联卷积层C<sub>l</sub>构建一个深度级联微神经网络;步骤3:设定该深度级联微神经网络的训练参数,采用随机梯度下降法进行训练;步骤4:采用softmax分类器进行分类,并利用前向传播算法计算分类误差;步骤5:利用反向传播运算更新神经网络中需要训练的参数的权重值;步骤6:重复步骤4至步骤5,直至验证误差不再变化为止,此时训练过程结束,得到一个深度级联微神经网络,该级联微神经网络可以高效地识别出相应类别的物体。 |