发明名称 组合降采样极限学机
摘要 本发明涉及一种组合降采样极限学机,包括:对于一个类数据不平衡的训练样本,首先对其中的多数样本(FP data)进行随机降采样,根据多数样本和少数样本的比值N,将其分割成N个多数类子样本;将N个多数类子样本分别与少数样本组合成N个训练子集;用得到的N个训练子集训练N个极限学机,得到N个分类器;将测试样本分别N个分类器,每个分类器得出一个分类结果;每个分类器的投票权重相同,设置一个决策阈值D,将分类结果组合后与决策阈值D相比较,决定最终分类结果。本发明具有较高的分类效率和简便的参数调整方法。
申请公布号 CN104573708A 申请公布日期 2015.04.29
申请号 CN201410802451.7 申请日期 2014.12.19
申请人 天津大学 发明人 闵行;褚晶辉;吕卫
分类号 G06K9/62(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 程毓英
主权项 一种组合降采样极限学习机,包括下面的几个方面:(2)对于一个类数据不平衡的训练样本,首先对其中的多数样本(FP data)进行随机降采样,根据多数样本和少数样本的比值N,将其分割成N个多数类子样本FP<sub>i</sub>(i=1,...,N);(3)将N个多数类子样本分别与少数样本组合成N个训练子集Train<sub>i</sub>(i=1,...,N);(4)用(2)得到的N个训练子集训练N个极限学习机,得到N个分类器;(5)将测试样本分别送入(3)得到的N个分类器,每个分类器得出一个分类结果。(6)每个分类器的投票权重相同,设置一个决策阈值D,将分类结果组合后与决策阈值D相比较,决定最终分类结果;通过调节决策阈值D,调整分类器对少数样本的关注程度,D越小则对少数样本的关注度越高。
地址 300072 天津市南开区卫津路92号