一种深度卷积神经网络的人脸识别方法,申请号CN201510170852.X-传众专利搜索

发明名称	一种深度卷积神经网络的人脸识别方法
摘要	公开一种深度卷积神经网络的人脸识别方法，其降低时间复杂度，使得在减少训练样本的情况下网络中权值依然有较强的分类能力。其包括训练阶段和分类阶段，训练阶段包括步骤：(1)随机生成输入单元与隐单元之间的权值w<sub>j</sub>和隐单元的偏置b<sub>j</sub>，j＝1,…,L，j为权值和偏置的个数，共L个；(2)输入训练图像Y及其标签，利用前向传导公式h<sub>W,b</sub>(x)＝f(W<sup>T</sup>x)，h<sub>W,b</sub>(x)为输出值，x为输入，计算每层输出值h<sub>W,b</sub>(x<sup>(i)</sup>)；(3)根据标签值和最后一层输出值计算出最后一层偏差；(4)根据最后一层偏差计算各层偏差，求得梯度方向；(5)更新权值；分类阶段包括步骤：(a)保持网络中所有的参数不变，记录每个测试样本由网络输出的类别向量；(b)计算残差δ＝\|\|h<sub>W,b</sub>(x<sup>(i)</sup>)-y<sup>(i)</sup>\|\|<sup>2</sup>；(c)根据残差最小，为测试图像分类。
申请公布号	CN104866810A	申请公布日期	2015.08.26
申请号	CN201510170852.X	申请日期	2015.04.10
申请人	北京工业大学	发明人	孙艳丰;齐光磊;胡永利
分类号	G06K9/00(2006.01)I;G06K9/66(2006.01)I	主分类号	G06K9/00(2006.01)I
代理机构	北京中北知识产权代理有限公司 11253	代理人	冯梦洪
主权项	一种深度卷积神经网络的人脸识别方法，其特征在于：其包括训练阶段和分类阶段，所述训练阶段包括以下步骤：(1)随机生成输入单元与隐单元之间的权值w<sub>j</sub>和隐单元的偏置b<sub>j</sub>，j＝1,…,L，j为权值和偏置的个数，共L个；(2)输入训练图像Y及其标签，利用前向传导公式h<sub>W,b</sub>(x)＝f(W<sup>T</sup>x)，其中，h<sub>W,b</sub>(x)为输出值，x为输入，计算每层输出值h<sub>W,b</sub>(x<sup>(i)</sup>)；(3)通过公式(4)根据标签值和步骤(2)的最后一层输出值计算出最后一层偏差<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>δ</mi><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup><mo>=</mo><mfrac><msub><mrow><mo>&PartialD;</mo><mi>J</mi></mrow><mn>1</mn></msub><msubsup><mrow><mo>&PartialD;</mo><mi>Z</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup></mfrac><mo>=</mo><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>Z</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>nl</mi><mo>)</mo></mrow></msubsup></mfrac><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mrow><mo>\|</mo><mo>\|</mo><msub><mi>h</mi><mrow><mi>W</mi><mo>,</mo><mi>b</mi></mrow></msub><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mo>-</mo><msup><mi>y</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>\|</mo><mo>\|</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000696746600000011.GIF" wi="1439" he="157" /></maths>(4)根据最后一层偏差计算各层偏差，从而求得梯度方向(BP算法的主要思想就是：要想求得总体网络的梯度方向，就要求出每层的偏差，反向传播算法就是首先求得最后一层的残差值，再追层求得所有层的残差，进而求得网络梯度方向)；(5)根据公式(2)、(3)更新权值<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>W</mi><mi>ij</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><msubsup><mi>W</mi><mi>ij</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>-</mo><mi>α</mi><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>W</mi></mrow><mi>ij</mi><mi>l</mi></msubsup></mfrac><mi>J</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000696746600000012.GIF" wi="1439" he="132" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>b</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>=</mo><msubsup><mi>b</mi><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup><mo>-</mo><mi>α</mi><mfrac><mo>&PartialD;</mo><msubsup><mrow><mo>&PartialD;</mo><mi>b</mi></mrow><mi>i</mi><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow></msubsup></mfrac><mi>J</mi><mrow><mo>(</mo><mi>W</mi><mo>,</mo><mi>b</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000696746600000013.GIF" wi="1452" he="138" /></maths>所述分类阶段包括以下步骤：(a)保持网络中所有的参数不变，记录每个测试样本由网络输出的类别向量；(b)计算残差δ＝\|\|h<sub>W,b</sub>(x<sup>(i)</sup>)‑y<sup>(i)</sup>\|\|<sup>2</sup>；(c)根据残差最小，为测试图像分类。
地址	100124 北京市朝阳区平乐园100号