发明名称 |
基于单类决策树的不平衡数据处理方法及装置 |
摘要 |
本发明提供了一种基于单类决策树的不平衡数据处理方法及装置,其中方法包括:对不平衡数据进行预处理;针对预处理后的不平衡数据,选取构单决策树的分类属性,构建单决策树,并在满足预定条件时终止构建单决策树;对所述构建好的单决策树进行剪枝处理;装置包括:预处理模块、构建模块以及剪枝模块;本发明采用目标类F值选取分裂属性,充分考虑数据的不平衡性,有效地对大数据中的小类样本数据进行分类,使分类结果更加准确,从而提高小类样本数据分类的准确率。 |
申请公布号 |
CN105630936A |
申请公布日期 |
2016.06.01 |
申请号 |
CN201510975984.X |
申请日期 |
2015.12.22 |
申请人 |
北京奇虎科技有限公司;重庆邮电大学 |
发明人 |
李智星;杨梦;王占一;赵蕊 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京天达知识产权代理事务所(普通合伙) 11386 |
代理人 |
马东伟;张春 |
主权项 |
一种基于单类决策树的不平衡数据处理方法,其特征在于,包括:对不平衡数据进行预处理;针对预处理后的不平衡数据,选取构单决策树的分类属性,构建单决策树,并在满足预定条件时终止构建单决策树;对所述构建好的单决策树进行剪枝处理。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |