发明名称 一种深度卷积神经网络的人脸识别方法
摘要 公开一种深度卷积神经网络的人脸识别方法,其降低时间复杂度,使得在减少训练样本的情况下网络中权值依然有较强的分类能力。其包括训练阶段和分类阶段,训练阶段包括步骤:(1)随机生成输入单元与隐单元之间的权值w<sub>j</sub>和隐单元的偏置b<sub>j</sub>,j=1,…,L,j为权值和偏置的个数,共L个;(2)输入训练图像Y及其标签,利用前向传导公式h<sub>W,b</sub>(x)=f(W<sup>T</sup>x),h<sub>W,b</sub>(x)为输出值,x为输入,计算每层输出值h<sub>W,b</sub>(x<sup>(i)</sup>);(3)根据标签值和最后一层输出值计算出最后一层偏差;(4)根据最后一层偏差计算各层偏差,求得梯度方向;(5)更新权值;分类阶段包括步骤:(a)保持网络中所有的参数不变,记录每个测试样本由网络输出的类别向量;(b)计算残差δ=||h<sub>W,b</sub>(x<sup>(i)</sup>)-y<sup>(i)</sup>||<sup>2</sup>;(c)根据残差最小,为测试图像分类。
申请公布号 CN104866810A 申请公布日期 2015.08.26
申请号 CN201510170852.X 申请日期 2015.04.10
申请人 北京工业大学 发明人 孙艳丰;齐光磊;胡永利
分类号 G06K9/00(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京中北知识产权代理有限公司 11253 代理人 冯梦洪
主权项 一种深度卷积神经网络的人脸识别方法,其特征在于:其包括训练阶段和分类阶段,所述训练阶段包括以下步骤:(1)随机生成输入单元与隐单元之间的权值w<sub>j</sub>和隐单元的偏置b<sub>j</sub>,j=1,…,L,j为权值和偏置的个数,共L个;(2)输入训练图像Y及其标签,利用前向传导公式h<sub>W,b</sub>(x)=f(W<sup>T</sup>x),其中,h<sub>W,b</sub>(x)为输出值,x为输入,计算每层输出值h<sub>W,b</sub>(x<sup>(i)</sup>);(3)通过公式(4)根据标签值和步骤(2)的最后一层输出值计算出最后一层偏差<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>&delta;</mi><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><msub><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><mn>1</mn></msub><msubsup><mrow><mo>&PartialD;</mo><mi>Z</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup></mfrac><mo>=</mo><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>Z</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup></mfrac><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mrow><mo>|</mo><mo>|</mo><msub><mi>h</mi><mrow><mi>W</mi><mo>,</mo><mi>b</mi></mrow></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>-</mo><msup><mi>y</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000696746600000011.GIF" wi="1439" he="157" /></maths>(4)根据最后一层偏差计算各层偏差,从而求得梯度方向(BP算法的主要思想就是:要想求得总体网络的梯度方向,就要求出每层的偏差,反向传播算法就是首先求得最后一层的残差值,再追层求得所有层的残差,进而求得网络梯度方向);(5)根据公式(2)、(3)更新权值<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>W</mi><mi>ij</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><msubsup><mi>W</mi><mi>ij</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>-</mo><mi>&alpha;</mi><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>W</mi></mrow><mi>ij</mi><mi>l</mi></msubsup></mfrac><mi>J</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000696746600000012.GIF" wi="1439" he="132" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>b</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><msubsup><mi>b</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>-</mo><mi>&alpha;</mi><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>b</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup></mfrac><mi>J</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000696746600000013.GIF" wi="1452" he="138" /></maths>所述分类阶段包括以下步骤:(a)保持网络中所有的参数不变,记录每个测试样本由网络输出的类别向量;(b)计算残差δ=||h<sub>W,b</sub>(x<sup>(i)</sup>)‑y<sup>(i)</sup>||<sup>2</sup>;(c)根据残差最小,为测试图像分类。
地址 100124 北京市朝阳区平乐园100号