发明名称 基于类Haar和AdaBoost分类器的快速增量学方法
摘要 本发明提供一种基于类Haar和AdaBoost分类器的快速增量学方法,属于图像检测技术领域。本发明对于新增加的未正确识别的训练样本集,在不损失已有学效果的前提下,增加一些关键的类Haar特征信息,而不是重新寻找关键类Haar特征信息,以提高训练的速度。本发明利用所提出的增量学方法较好地解决了快速提升基于类Haar特征和AdaBoost分类器方法的识别性能问题,将其应用于车辆图像检测实验,与传统增量学方法相比,在两者提升识别性能相近的情形下,明显减少了学机的学时间。
申请公布号 CN101937510A 申请公布日期 2011.01.05
申请号 CN201010280839.7 申请日期 2010.09.14
申请人 南京信息工程大学 发明人 文学志;方巍;郑钰辉
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 许方
主权项 1.一种基于类Haar和AdaBoost分类器的快速增量学习方法,其特征在于:所述快速增量学习方法对于未正确识别的新增加的训练样本集,采用原始训练样本集所得到的关键类Haar特征集为基础,通过增加新的关键类Haar特征来完成学习机的增量学习,具体步骤如下:设新增加的未正确识别训练样本集合为Δ,样本集合Δ的样本数量为m,样本集合Δ与原始训练样本集合的并集为Ω,样本并集Ω的样本总数为n,基于原始训练样本集合得到的关键类Haar特征集为Γ;样本集合Δ的初始权值为u<sub>1</sub>(i)=1/m,其中i=1,2,…,m;样本并集Ω的初始权值为v<sub>1</sub>(i′)=1/(n),其中i′=1,2,…,n;m、n均为自然数;A、归一化样本并集Ω的权值:<maths num="0001"><![CDATA[<math><mrow><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>=</mo><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>/</mo><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>B、基于样本集合Δ寻找关键特征:1)归一化样本集合Δ的权值:<img file="FSA00000268539300012.GIF" wi="451" he="114" />其中t代表迭代次数,t=1,2,…,T,T为自然数;2)在样本集合Δ上构造弱分类器集合,采用(1)式寻找分类误差最小的弱分类器φ<sub>t</sub>和关键类Haar特征δ,<maths num="0002"><![CDATA[<math><mrow><msub><mi>&epsiv;</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>u</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>|</mo><msub><mi>&phi;</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>&delta;</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>-</mo><msub><mi>y</mi><mi>i</mi></msub><mo>|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中ε<sub>t</sub>代表分类误差,φ<sub>t</sub>(δ(x<sub>i</sub>))表示对样本x<sub>i</sub>上的关键特征δ的分类结果,y<sub>i</sub>代表样本x<sub>i</sub>的真实类别;C、若关键类Haar特征δ属于采用原始训练样本集所得到的关键类Haar特征集;直接进入下一步骤;否则,则将所述关键类Haar特征δ添加进基于原始训练样本集所得到的关键类Haar特征集Γ,进入下一步骤;D、在所述样本并集Ω和C步骤得到的关键类Haar特征集Γ上,构造弱分类器集合,并采用(2)式寻找误差最小的弱分类器f<sub>t</sub>和关键类Haar特征η,<maths num="0003"><![CDATA[<math><mrow><msub><mi>E</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>+</mo><mi>n</mi></mrow></munderover><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>|</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>&eta;</mi><mrow><mo>(</mo><msub><mi>x</mi><msup><mi>i</mi><mo>&prime;</mo></msup></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>-</mo><msub><mi>y</mi><msup><mi>i</mi><mo>&prime;</mo></msup></msub><mo>|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中E<sub>t</sub>代表分类误差,f<sub>t</sub>(η(x<sub>i′</sub>))表示弱分类器f<sub>t</sub>对样本x<sub>i′</sub>上的关键特征η的分类结果;E、在所述样本并集Ω上计算分类权值<img file="FSA00000268539300022.GIF" wi="470" he="107" />α<sub>t</sub>代表分类权值;F、更新样本并集Ω的权值:<img file="FSA00000268539300023.GIF" wi="588" he="85" />f<sub>t</sub>(x<sub>i′</sub>)表示弱分类器f<sub>t</sub>对样本x<sub>i′</sub>的分类结果,e为自然对数底且e为常数;G、更新样本集合Δ的权值:u<sub>t</sub>(i)=exp(-y<sub>i</sub>ψ<sub>t</sub>(x<sub>i</sub>)),其中ψ<sub>t</sub>(x<sub>i</sub>)=p<sub>t</sub>(θ<sub>t</sub>-δ(x<sub>i</sub>)),p<sub>t</sub>∈{-1,+1}表示分类方向,θ<sub>t</sub>为弱分类器在类Haar特征δ上的分类阈值,δ(x<sub>i</sub>)表示样本x<sub>i</sub>上的关键类Haar特征;H、如果在样本并集Ω上由弱分类器组成的强分类器F(x)=sign(∑α<sub>t</sub>f<sub>t</sub>(x))对样本并集Ω的识别效果达到期望值,则输出分类器以及所选取的关键类Haar特征集;否则,返回A步骤。
地址 210044 江苏省南京市宁六路219号