基于Adaboost算法的人脸识别优化方法,申请号CN201510203079.2-传众专利搜索

发明名称	基于Adaboost算法的人脸识别优化方法
摘要	基于Adaboost算法的人脸识别优化方法，首先对人脸图像进行特征提取和降维，用降维后的矩阵数据，使用SAMME.R算法进行识别分类；在训练弱分类器时，判断该弱分类器的结果，在所有同属一类的样本的分类中，正确分类的样本的权值和，是否比分到其他任意一类的权值和大；如果满足该条件则继续进行权值调整和下一次迭代；如果不满足，由于训练出的弱分类器不够好，达不到要求，所以在权值不变的情况下重新训练弱分类器，然后再次判断新的弱分类器是否满足上边所述的条件，如果满足进入下一次调整，不满足继续重新训练弱分类器，不断优化弱分类器的质量，从而逼近最优强分类器；得到最终的强分类器有效提高了人脸识别的准确率。
申请公布号	CN104820825A	申请公布日期	2015.08.05
申请号	CN201510203079.2	申请日期	2015.04.27
申请人	北京工业大学	发明人	杨新武;袁顺;马壮
分类号	G06K9/00(2006.01)I;G06K9/62(2006.01)I	主分类号	G06K9/00(2006.01)I
代理机构	北京思海天达知识产权代理有限公司 11203	代理人	沈波
主权项	基于Adaboost算法的人脸识别优化方法，其特征在于：首先对人脸图像进行特征提取和降维，即利用(2D)<sup>2</sup>PCA算法对图像进行特征提取和降维，同时在行与列上对图像矩阵进行降维，进一步降低特征向量的维数，有效降低问题的时间复杂度；用降维后的矩阵数据，使用SAMME.R算法进行识别分类；该方法是把对弱分类器正确率的要求降低到大于for j＝1,...,K 1/k，保证提供足够多的弱分类器参与集成；在训练弱分类器时，判断该弱分类器的结果，在所有同属一类的样本的分类中，正确分类的样本的权值和，是否比分到其他任意一类的权值和大；如果满足该条件则继续进行权值调整和下一次迭代；如果不满足，由于训练出的弱分类器不够好，达不到要求，所以在权值不变的情况下重新训练弱分类器，然后再次判断新的弱分类器是否满足上边所述的条件，如果满足进入下一次调整，不满足继续重新训练弱分类器，不断优化弱分类器的质量，从而逼近最优强分类器；得到最终的强分类器有效提高了人脸识别的准确率；其具体步骤如下：步骤一：数据初始化1.1)对人脸库中的所有图像进行归一化处理，归一化的操作是指先把图像统一大小为32×32灰度值矩阵，得到大小为1024×1的灰度值矩阵，用(2D)<sup>2</sup>PCA算法降维得到大小为256×1的矩阵；初始化权值<img file="FDA0000706365410000011.GIF" wi="326" he="117" />i＝1,...,m；其中m是图像个数；步骤二：循环处理过程2.1)for 1,...,T，执行以下7步：①按照权值w<sup>t</sup>，选择图像样本；②对样本进行分类识别，h<sub>t</sub>:X→Y；即将每个样本用最近邻弱分类器进行分类识别，其中X是样本,Y是样本分类结果；③for k＝1,...,K，执行以下2步；进行权值调整；(1)循环计算各类中，分到各类样本的权值和for j＝1,...,K<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>γ</mi><mi>tkj</mi></msub><mo>=</mo><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><msubsup><mi>w</mi><mi>i</mi><mi>t</mi></msubsup><mo>[</mo><msub><mi>y</mi><mi>i</mi></msub><mo>=</mo><mi>k</mi><mo>,</mo><msub><mi>h</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>j</mi><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000021.GIF" wi="632" he="88" /></maths>(2)判断各类中分类正确的样本权值和是否大于分到<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mn>1</mn><mo>-</mo><msub><mi>ϵ</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>k</mi></mfrac><mo>+</mo><msub><mi>r</mi><mi>t</mi></msub><mo>></mo><mn>0</mn><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&NotEqual;</mo><msub><mi>y</mi><mi>i</mi></msub><mo>]</mo><mo>/</mo><msub><mi>mx</mi><mi>i</mi></msub></mrow>]]></math><img file="FDA0000706365410000022.GIF" wi="836" he="132" /></maths>其他各类样本的权值和<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>γ</mi><mi>tkj</mi></msub><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>j</mi><mo>]</mo><mo>></mo><mo>=</mo><mo>&ForAll;</mo><msub><mi>γ</mi><mi>tkj</mi></msub><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&NotEqual;</mo><mi>j</mi><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000023.GIF" wi="685" he="79" /></maths>若满足，则进行下一次循环；若不满足，则返回步骤二重新开始计算；其中K是采样个数；④计算h<sub>t</sub>的伪错误率：<img file="FDA0000706365410000024.GIF" wi="518" he="93" />用于判断算法的的识别效果；⑤置<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>a</mi><mi>t</mi></msub><mo>=</mo><mi>ln</mi><mfrac><msub><mi>ϵ</mi><mi>t</mi></msub><mrow><mn>1</mn><mo>-</mo><msub><mi>ϵ</mi><mi>t</mi></msub></mrow></mfrac><mo>+</mo><mi>ln</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000706365410000025.GIF" wi="485" he="131" /></maths>算法收敛阈值；⑥计算新的权重向量<img file="FDA0000706365410000026.GIF" wi="647" he="77" />用于后续图像的选择；⑦归一化权值<img file="FDA0000706365410000027.GIF" wi="112" he="84" />使之在0‑1范围内；其中T为迭代次数；步骤三：最终强分类器3.1)<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>h</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mi>arg</mi><munder><mi>max</mi><mrow><mi>y</mi><mo>&Element;</mo><mi>Y</mi></mrow></munder><munderover><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><msub><mi>a</mi><mi>t</mi></msub><mo>·</mo><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>y</mi><mi>t</mi></msub><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000031.GIF" wi="700" he="147" /></maths>其中h<sub>f</sub>(x)为最终生成的强分类器，用于人脸识别分类，输出分类结果；x为输入的人脸头像数据，T为迭代次数，h<sub>t</sub>(x<sub>t</sub>)为弱分类器，y<sub>i</sub>为类别标号。
地址	100124 北京市朝阳区平乐园100号