发明名称 基于Adaboost算法的人脸识别优化方法
摘要 基于Adaboost算法的人脸识别优化方法,首先对人脸图像进行特征提取和降维,用降维后的矩阵数据,使用SAMME.R算法进行识别分类;在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率。
申请公布号 CN104820825A 申请公布日期 2015.08.05
申请号 CN201510203079.2 申请日期 2015.04.27
申请人 北京工业大学 发明人 杨新武;袁顺;马壮
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 沈波
主权项 基于Adaboost算法的人脸识别优化方法,其特征在于:首先对人脸图像进行特征提取和降维,即利用(2D)<sup>2</sup>PCA算法对图像进行特征提取和降维,同时在行与列上对图像矩阵进行降维,进一步降低特征向量的维数,有效降低问题的时间复杂度;用降维后的矩阵数据,使用SAMME.R算法进行识别分类;该方法是把对弱分类器正确率的要求降低到大于for j=1,...,K 1/k,保证提供足够多的弱分类器参与集成;在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率;其具体步骤如下:步骤一:数据初始化1.1)对人脸库中的所有图像进行归一化处理,归一化的操作是指先把图像统一大小为32×32灰度值矩阵,得到大小为1024×1的灰度值矩阵,用(2D)<sup>2</sup>PCA算法降维得到大小为256×1的矩阵;初始化权值<img file="FDA0000706365410000011.GIF" wi="326" he="117" />i=1,...,m;其中m是图像个数;步骤二:循环处理过程2.1)for 1,...,T,执行以下7步:①按照权值w<sup>t</sup>,选择图像样本;②对样本进行分类识别,h<sub>t</sub>:X→Y;即将每个样本用最近邻弱分类器进行分类识别,其中X是样本,Y是样本分类结果;③for k=1,...,K,执行以下2步;进行权值调整;(1)循环计算各类中,分到各类样本的权值和for j=1,...,K<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>&gamma;</mi><mi>tkj</mi></msub><mo>=</mo><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><msubsup><mi>w</mi><mi>i</mi><mi>t</mi></msubsup><mo>[</mo><msub><mi>y</mi><mi>i</mi></msub><mo>=</mo><mi>k</mi><mo>,</mo><msub><mi>h</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>j</mi><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000021.GIF" wi="632" he="88" /></maths>(2)判断各类中分类正确的样本权值和是否大于分到<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mn>1</mn><mo>-</mo><msub><mi>&epsiv;</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>k</mi></mfrac><mo>+</mo><msub><mi>r</mi><mi>t</mi></msub><mo>></mo><mn>0</mn><msubsup><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></msubsup><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&NotEqual;</mo><msub><mi>y</mi><mi>i</mi></msub><mo>]</mo><mo>/</mo><msub><mi>mx</mi><mi>i</mi></msub></mrow>]]></math><img file="FDA0000706365410000022.GIF" wi="836" he="132" /></maths>其他各类样本的权值和<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>&gamma;</mi><mi>tkj</mi></msub><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>j</mi><mo>]</mo><mo>></mo><mo>=</mo><mo>&ForAll;</mo><msub><mi>&gamma;</mi><mi>tkj</mi></msub><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&NotEqual;</mo><mi>j</mi><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000023.GIF" wi="685" he="79" /></maths>若满足,则进行下一次循环;若不满足,则返回步骤二重新开始计算;其中K是采样个数;④计算h<sub>t</sub>的伪错误率:<img file="FDA0000706365410000024.GIF" wi="518" he="93" />用于判断算法的的识别效果;⑤置<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>a</mi><mi>t</mi></msub><mo>=</mo><mi>ln</mi><mfrac><msub><mi>&epsiv;</mi><mi>t</mi></msub><mrow><mn>1</mn><mo>-</mo><msub><mi>&epsiv;</mi><mi>t</mi></msub></mrow></mfrac><mo>+</mo><mi>ln</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000706365410000025.GIF" wi="485" he="131" /></maths>算法收敛阈值;⑥计算新的权重向量<img file="FDA0000706365410000026.GIF" wi="647" he="77" />用于后续图像的选择;⑦归一化权值<img file="FDA0000706365410000027.GIF" wi="112" he="84" />使之在0‑1范围内;其中T为迭代次数;步骤三:最终强分类器3.1)<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>h</mi><mi>f</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mi>arg</mi><munder><mi>max</mi><mrow><mi>y</mi><mo>&Element;</mo><mi>Y</mi></mrow></munder><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></munderover><msub><mi>a</mi><mi>t</mi></msub><mo>&CenterDot;</mo><mo>[</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>y</mi><mi>t</mi></msub><mo>]</mo></mrow>]]></math><img file="FDA0000706365410000031.GIF" wi="700" he="147" /></maths>其中h<sub>f</sub>(x)为最终生成的强分类器,用于人脸识别分类,输出分类结果;x为输入的人脸头像数据,T为迭代次数,h<sub>t</sub>(x<sub>t</sub>)为弱分类器,y<sub>i</sub>为类别标号。
地址 100124 北京市朝阳区平乐园100号