发明名称 一种基于浮动分类阈值的分类器集成方法
摘要 本发明公开了一种基于浮动分类阈值的分类器集成方法,该方法通过迭代T次,训练得到T个最佳弱分类器,然后组合T个最佳弱分类器得到最佳组合分类器。当针对二分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值<img file="DDA0000060528200000011.GIF" wi="44" he="52" />的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值<img file="DDA0000060528200000012.GIF" wi="481" he="109" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T;当针对多分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值<img file="DDA0000060528200000013.GIF" wi="44" he="52" />的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值<img file="DDA0000060528200000014.GIF" wi="829" he="147" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T。本发明相对于现有技术,能克服固定分类阈值分类器对分类边界附近点分类不稳定的这一缺点。
申请公布号 CN102163239B 申请公布日期 2014.04.23
申请号 CN201110121230.X 申请日期 2011.05.11
申请人 中科院成都信息技术股份有限公司 发明人 付忠良;赵向辉;姚宇;张丹普
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 成都赛恩斯知识产权代理事务所(普通合伙) 51212 代理人 朱月仙
主权项 1.一种基于浮动分类阈值的分类器集成方法,用于人脸检测,所述方法包括如下步骤:(1)获取训练样本集S,所述训练样本集S为人脸检测数据集;(2)初始化样本权值并赋初值,<img file="FDA00004167488600000111.GIF" wi="235" he="83" />i=1,...,m;(3)迭代T次,训练得到T个最佳弱分类器;(4)组合T个最佳弱分类器得到最佳组合分类器,其特征在于,当针对二分类问题时,所述步骤(3)包括如下步骤:(3.1)基于有权值<img file="FDA00004167488600000112.GIF" wi="53" he="63" />的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间<img file="FDA00004167488600000113.GIF" wi="82" he="72" />i=1,...,m;②定义弱分类器h<sub>t</sub>(x),令<maths num="0001"><![CDATA[<math><mrow><msub><mi>h</mi><mi>t</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mn>0.5</mn><mo>&times;</mo><mi>ln</mi><mrow><mo>(</mo><msubsup><mi>p</mi><mi>t</mi><mrow><mi>i</mi><mo>,</mo><mn>1</mn></mrow></msubsup><mo>/</mo><msubsup><mi>p</mi><mi>t</mi><mrow><mi>i</mi><mo>,</mo><mo>-</mo><mn>1</mn></mrow></msubsup><mo>)</mo></mrow><mo>,</mo><msubsup><mi>p</mi><mi>t</mi><mrow><mi>i</mi><mo>,</mo><mi>l</mi></mrow></msubsup><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>:</mo><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>&Element;</mo><msubsup><mi>S</mi><mi>i</mi><mi>t</mi></msubsup><mo>,</mo><msub><mi>y</mi><mi>i</mi></msub><mo>=</mo><mi>l</mi><mo>)</mo></mrow></mrow></munder><msubsup><mi>&omega;</mi><mi>i</mi><mi>t</mi></msubsup><mo>,</mo></mrow></math>]]></maths>l=1,-1,其中x<sub>i</sub>代表第i个样本的具体值,y<sub>i</sub>代表第i个样本的类别,<img file="FDA0000416748860000012.GIF" wi="83" he="83" />代表<img file="FDA0000416748860000013.GIF" wi="60" he="83" />中l类样本权值之和,l代表二分类问题中类别为1和-1的类,即<img file="FDA0000416748860000014.GIF" wi="108" he="107" />与<img file="FDA0000416748860000015.GIF" wi="140" he="107" />为包含x<sub>i</sub>,以x<sub>i</sub>为中心样本空间的一个子集的正类样本累积权值与反类样本累积权值,每一个x<sub>i</sub>得到样本空间S的一个子集<img file="FDA0000416748860000016.GIF" wi="581" he="84" />但i≠j时,允许<img file="FDA0000416748860000017.GIF" wi="288" he="90" />③选取弱分类器h<sub>t</sub>(x),使<img file="FDA0000416748860000018.GIF" wi="470" he="126" />最小,其中Z<sub>t</sub>代表样本权值调整后的归一化因子;(3.2)根据步骤(3.1)的结果调整样本权值<img file="FDA0000416748860000019.GIF" wi="500" he="124" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。
地址 610041 四川省成都市成都高新区创业东路管委会高新大厦11楼5号