基于类Haar和AdaBoost分类器的快速增量学方法,申请号CN201010280839.7-传众专利搜索

发明名称	基于类Haar和AdaBoost分类器的快速增量学方法
摘要	本发明提供一种基于类Haar和AdaBoost分类器的快速增量学方法，属于图像检测技术领域。本发明对于新增加的未正确识别的训练样本集，在不损失已有学效果的前提下，增加一些关键的类Haar特征信息，而不是重新寻找关键类Haar特征信息，以提高训练的速度。本发明利用所提出的增量学方法较好地解决了快速提升基于类Haar特征和AdaBoost分类器方法的识别性能问题，将其应用于车辆图像检测实验，与传统增量学方法相比，在两者提升识别性能相近的情形下，明显减少了学机的学时间。
申请公布号	CN101937510A	申请公布日期	2011.01.05
申请号	CN201010280839.7	申请日期	2010.09.14
申请人	南京信息工程大学	发明人	文学志;方巍;郑钰辉
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	南京经纬专利商标代理有限公司 32200	代理人	许方
主权项	1.一种基于类Haar和AdaBoost分类器的快速增量学习方法，其特征在于：所述快速增量学习方法对于未正确识别的新增加的训练样本集，采用原始训练样本集所得到的关键类Haar特征集为基础，通过增加新的关键类Haar特征来完成学习机的增量学习，具体步骤如下：设新增加的未正确识别训练样本集合为Δ，样本集合Δ的样本数量为m，样本集合Δ与原始训练样本集合的并集为Ω，样本并集Ω的样本总数为n，基于原始训练样本集合得到的关键类Haar特征集为Γ；样本集合Δ的初始权值为u<sub>1</sub>(i)＝1/m，其中i＝1，2，…，m；样本并集Ω的初始权值为v<sub>1</sub>(i′)＝1/(n)，其中i′＝1，2，…，n；m、n均为自然数；A、归一化样本并集Ω的权值：<maths num="0001"><![CDATA[<math><mrow><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>=</mo><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>/</mo><munderover><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>B、基于样本集合Δ寻找关键特征：1)归一化样本集合Δ的权值：<img file="FSA00000268539300012.GIF" wi="451" he="114" />其中t代表迭代次数，t＝1，2，…，T，T为自然数；2)在样本集合Δ上构造弱分类器集合，采用(1)式寻找分类误差最小的弱分类器φ<sub>t</sub>和关键类Haar特征δ，<maths num="0002"><![CDATA[<math><mrow><msub><mi>ϵ</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>u</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>\|</mo><msub><mi>φ</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>δ</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>-</mo><msub><mi>y</mi><mi>i</mi></msub><mo>\|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中ε<sub>t</sub>代表分类误差，φ<sub>t</sub>(δ(x<sub>i</sub>))表示对样本x<sub>i</sub>上的关键特征δ的分类结果，y<sub>i</sub>代表样本x<sub>i</sub>的真实类别；C、若关键类Haar特征δ属于采用原始训练样本集所得到的关键类Haar特征集；直接进入下一步骤；否则，则将所述关键类Haar特征δ添加进基于原始训练样本集所得到的关键类Haar特征集Γ，进入下一步骤；D、在所述样本并集Ω和C步骤得到的关键类Haar特征集Γ上，构造弱分类器集合，并采用(2)式寻找误差最小的弱分类器f<sub>t</sub>和关键类Haar特征η，<maths num="0003"><![CDATA[<math><mrow><msub><mi>E</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>Σ</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>+</mo><mi>n</mi></mrow></munderover><msub><mi>v</mi><mi>t</mi></msub><mrow><mo>(</mo><msup><mi>i</mi><mo>′</mo></msup><mo>)</mo></mrow><mo>\|</mo><msub><mi>f</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>η</mi><mrow><mo>(</mo><msub><mi>x</mi><msup><mi>i</mi><mo>′</mo></msup></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>-</mo><msub><mi>y</mi><msup><mi>i</mi><mo>′</mo></msup></msub><mo>\|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中E<sub>t</sub>代表分类误差，f<sub>t</sub>(η(x<sub>i′</sub>))表示弱分类器f<sub>t</sub>对样本x<sub>i′</sub>上的关键特征η的分类结果；E、在所述样本并集Ω上计算分类权值<img file="FSA00000268539300022.GIF" wi="470" he="107" />α<sub>t</sub>代表分类权值；F、更新样本并集Ω的权值：<img file="FSA00000268539300023.GIF" wi="588" he="85" />f<sub>t</sub>(x<sub>i′</sub>)表示弱分类器f<sub>t</sub>对样本x<sub>i′</sub>的分类结果，e为自然对数底且e为常数；G、更新样本集合Δ的权值：u<sub>t</sub>(i)＝exp(-y<sub>i</sub>ψ<sub>t</sub>(x<sub>i</sub>))，其中ψ<sub>t</sub>(x<sub>i</sub>)＝p<sub>t</sub>(θ<sub>t</sub>-δ(x<sub>i</sub>))，p<sub>t</sub>∈{-1，+1}表示分类方向，θ<sub>t</sub>为弱分类器在类Haar特征δ上的分类阈值，δ(x<sub>i</sub>)表示样本x<sub>i</sub>上的关键类Haar特征；H、如果在样本并集Ω上由弱分类器组成的强分类器F(x)＝sign(∑α<sub>t</sub>f<sub>t</sub>(x))对样本并集Ω的识别效果达到期望值，则输出分类器以及所选取的关键类Haar特征集；否则，返回A步骤。
地址	210044 江苏省南京市宁六路219号