发明名称 一种基于浮动分类阈值的分类器集成方法
摘要 本发明公开了一种基于浮动分类阈值的分类器集成方法,该方法通过迭代T次,训练得到T个最佳弱分类器,然后组合T个最佳弱分类器得到最佳组合分类器。当针对二分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值<img file="dda0000060528200000011.GIF" wi="46" he="54" />的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值<img file="dda0000060528200000012.GIF" wi="483" he="111" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T;当针对多分类问题时,训练T个最佳弱分类器包括:(3.1)基于有权值<img file="dda0000060528200000013.GIF" wi="46" he="54" />的训练样本集S训练弱分类器,t=1,...,T;(3.2)根据步骤(3.1)的结果调整样本权值<img file="dda0000060528200000014.GIF" wi="831" he="149" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回(3.1),直至t=T。本发明相对于现有技术,能克服固定分类阈值分类器对分类边界附近点分类不稳定的这一缺点。
申请公布号 CN102163239A 申请公布日期 2011.08.24
申请号 CN201110121230.X 申请日期 2011.05.11
申请人 中科院成都信息技术有限公司 发明人 付忠良;赵向辉;姚宇;张丹普
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 成都赛恩斯知识产权代理事务所(普通合伙) 51212 代理人 朱月仙
主权项 1.一种基于浮动分类阈值的分类器集成方法,所述方法包括如下步骤:(1)获取训练样本集S;(2)初始化样本权值并赋初值,<img file="FDA0000060528170000011.GIF" wi="477" he="68" />(3)迭代T次,训练得到T个最佳弱分类器;(4)组合T个最佳弱分类器得到最佳组合分类器,其特征在于,当针对二分类问题时,所述步骤(3)包括如下步骤:(3.1)基于有权值<img file="FDA0000060528170000012.GIF" wi="46" he="54" />的训练样本集S训练弱分类器,t=1,...,T,通过如下步骤实现:①对应训练样本集S的划分,定义一个区间<img file="FDA0000060528170000013.GIF" wi="73" he="64" />i=1,...,m;②定义弱分类器ht(x),令<img file="FDA0000060528170000014.GIF" wi="563" he="97" /><img file="FDA0000060528170000015.GIF" wi="414" he="120" />l=1,-1,其中x<sub>i</sub>代表第i个样本的具体值,y<sub>i</sub>代表第i个样本的类别,<img file="FDA0000060528170000016.GIF" wi="68" he="63" />代表<img file="FDA0000060528170000017.GIF" wi="49" he="64" />中l类样本权值之和,l代表二分类问题中类别为1和-1的类;③选取弱分类器h<sub>t</sub>(x),使<img file="FDA0000060528170000018.GIF" wi="454" he="106" />最小,其中Z<sub>t</sub>代表样本权值调整后的归一化因子;(3.2)根据步骤(3.1)的结果调整样本权值<img file="FDA0000060528170000019.GIF" wi="482" he="111" />(3.3)判断t是否小于T,若是,则令t=t+1,并返回步骤(3.1),若否,则进入步骤(4)。
地址 610041 四川省成都市人民南路四段9号