发明名称 基于冗余特征消减AdaBoost分类器的物体检测方法
摘要 一种基于冗余特征消减AdaBoost分类器的物体检测方法,(1)分类器训练:在初次使用AdaBoost分类器之前需要使用一个丰富完备特征集和大量的训练样本对分类器进行训练,使用了基于权重的冗余特征消减对传统训练过程进行了改进;(2)物体特征提取:使用特征提取算法提取需要检测的物体的特征,如haar特征;(3)输入特征:将在(2)中得到的特征输入训练完毕的分类器;(4)得到检测结果:分类器对输入的特征进行二元分类,确定输入的特征是否属于待检测的物体,输出检测结果。
申请公布号 CN102129565B 申请公布日期 2013.11.13
申请号 CN201110049377.2 申请日期 2011.03.01
申请人 北京航空航天大学 发明人 闻佳;李超;余建;郭信谊;熊璋
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京慧泉知识产权代理有限公司 11232 代理人 王顺荣;唐爱华
主权项 1.基于冗余特征消减AdaBoost分类器的物体检测方法,其特征在于包括以下步骤:(1)分类器训练:在初次使用AdaBoost分类器之前,使用基于权重的冗余特征消减对传统训练过程进行改进,对分类器进行训练,同时进行特征选择;(2)物体特征提取:使用特征提取算法提取需要检测的物体的特征;(3)输入特征:将在步骤(2)中得到的特征输入步骤(1)训练完毕的分类器;(4)得到检测结果:分类器对输入的特征进行二元分类,确定输入的特征是否属于待检测的物体,输出检测结果;其中,所述步骤(1)基于冗余特征消减AdaBoost分类器的分类器训练方法如下:1)输入:一个特征集合F={f<sub>1</sub>,...,f<sub>K</sub>}以及S={(x<sub>1</sub>,y<sub>1</sub>),.....,(x<sub>N</sub>,y<sub>N</sub>)}这是一个带有标签的训练集合,其中y<sub>i</sub>={0,1}分别对应正样本与负样本,一个组合分类器h和一个给定的循环次数T,消除系数λ,以及关联阈值γ;2)初始化:数据集<img file="FDA00003022741400011.GIF" wi="156" he="87" />初始化训练样本权重:当y<sub>i</sub>=0,<img file="FDA00003022741400012.GIF" wi="311" he="150" />当y<sub>j</sub>=1时,<img file="FDA00003022741400013.GIF" wi="213" he="126" />其中m和l分别代表负样本和正样本的个数,特征权重D:d<sub>1,i</sub>=1.0,特征阈值θ=0.0,以及消除速率<img file="FDA00003022741400014.GIF" wi="236" he="120" />3)进行T次循环,每次循环过程如下:①归一化权重:<img file="FDA00003022741400021.GIF" wi="590" he="104" />使w<sub>t</sub>成为概率分布;②对每个在F中且权值d<sub>j</sub>&gt;θ的特征f<sub>j</sub>,训练分类器h<sub>j</sub>;估计w<sub>t</sub>的错误率ε<sub>j</sub>=∑<sub>i</sub>w<sub>t,i</sub>h<sub>j</sub>(x<sub>i</sub>)-y<sub>i</sub>;③用最小错误率ε<sub>t</sub>选择分类器h<sub>t</sub>,同时G←G∪{f<sub>t</sub>};④执行elimination_redundance(F,S,D<sub>t</sub>,w<sub>t</sub>,G<sub>t</sub>,f<sub>t</sub>,h,l,θ,γ)过程,即执行冗余特征消减过程;⑤在e<sub>i</sub>=0处,更新权值<img file="FDA00003022741400022.GIF" wi="334" he="80" />若样本x<sub>i</sub>分类正确,则e<sub>i</sub>=1,并且<maths num="0001"><![CDATA[<math><mrow><msub><mi>&beta;</mi><mi>t</mi></msub><mo>=</mo><mfrac><msub><mi>&epsiv;</mi><mi>t</mi></msub><mrow><mn>1</mn><mo>-</mo><msub><mi>&epsiv;</mi><mi>t</mi></msub></mrow></mfrac><mo>;</mo></mrow></math>]]></maths>4)输出:强分类器<maths num="0002"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></msubsup><msub><mi>&alpha;</mi><mi>t</mi></msub><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><msubsup><mi>&Sigma;</mi><mrow><mi>t</mi><mo>=</mo><mn>1</mn></mrow><mi>T</mi></msubsup><msub><mi>&alpha;</mi><mi>t</mi></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>otherwise</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>其中<maths num="0003"><![CDATA[<math><mrow><msub><mi>&alpha;</mi><mi>t</mi></msub><mo>=</mo><mi>log</mi><mfrac><mn>1</mn><msub><mi>&beta;</mi><mi>t</mi></msub></mfrac><mo>,</mo></mrow></math>]]></maths>同时选择了G中的T个特征;其中,所述步骤3)中的执行elimination_redundance(F,S,D<sub>t</sub>,w<sub>t</sub>,G<sub>t</sub>,f<sub>t</sub>,h,l,θ,γ)冗余特征消减过程如下:(1)输入:输入变量为elimination_redundance(F,S,D<sub>t</sub>,w<sub>t</sub>,G<sub>t</sub>,f<sub>t</sub>,h,l,θ,γ),其中,F代表特征集合,S代表带有标签的训练集合,D<sub>t</sub>代表特征权重,w<sub>t</sub>代表样本权重,G是数据集,f<sub>t</sub>代表特征,h代表当前分类器,l代表正样本数,θ代表特征阈值,γ代表关联阈值;(2)初始化:将f<sub>t</sub>权值置为d<sub>t</sub>=0,置关联序列R为空,即<img file="FDA00003022741400027.GIF" wi="151" he="64" />(3)对<img file="FDA00003022741400028.GIF" wi="374" he="86" />权值d<sub>j</sub>&gt;0的进行如下操作:①计算f<sub>t</sub>与f<sub>j</sub>的关联值,<maths num="0004"><![CDATA[<math><mrow><msub><mi>c</mi><mrow><mi>t</mi><mo>,</mo><mi>j</mi></mrow></msub><mo>=</mo><msubsup><mi>&Sigma;</mi><mi>i</mi><mi>N</mi></msubsup><msub><mi>w</mi><mrow><mi>t</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>|</mo><msub><mi>h</mi><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>-</mo><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow></math>]]></maths>②将c<sub>t,j</sub>插入序列R中,并以升序排列;(4)当j&lt;l,c<sub>t,j</sub>≤γ时将特征权值置为:d<sub>j</sub>=0,其中j是对应特征f<sub>j</sub>的序号。
地址 100191 北京市海淀区学院路37号