发明名称 一种双度集成的不均衡数据流分类算法
摘要 本发明公开了一种双度集成的不均衡数据流分类算法,包括均衡数据流分类模型预测、分类可信度评估和和不均衡数据流分类模型预测三个阶段。其中,均衡数据流分类模型首先预测每条数据记录的分类;分类可信度评估对均衡数据流分类模型预测阶段的分类结果进行可信度评估,可信度高的记录的分类结果直接返回给用户,而可信度低的数据记录需要经过不均衡数据流分类模型预测阶段的再次分类。本发明中的方法可广泛应用于计算机辅助临床诊断、实时入侵检测等应用中,属于人工智能应用领域。
申请公布号 CN103593470A 申请公布日期 2014.02.19
申请号 CN201310624425.5 申请日期 2013.11.29
申请人 河南大学 发明人 张重生
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 郑州联科专利事务所(普通合伙) 41104 代理人 刘建芳;李伊宁
主权项 一种双度集成的不均衡数据流分类算法,其特征在于:包括以下几个步骤:A: 均衡数据流分类模型和非均衡数据流分类模型训练阶段:对于训练数据集中的每一个最新的数据流记录块,将其分割为训练集和验证集;在训练集上分别训练一个均衡的分类模型和一个非均衡的分类模型;保留在验证集上分类准确度最高的n个均衡的分类模型和n个非均衡的分类模型;B: 利用步骤A中的n个均衡数据流分类模型和n个非均衡数据流分类模型对验证集中的数据记录进行分类并进行可信度评估,最终得出优化的可信度阈值δ;C: 使用步骤A中的n个均衡数据流分类模型和n个非均衡数据流分类模型对于测试数据集中的每一个数据记录进行分类,并输出最终分类结果。
地址 475004 河南省开封市金明大道