发明名称 一种基于动态二叉树的SVM多分类方法
摘要 本发明公开了一种基于动态二叉树的SVM多分类方法,属于数据挖掘技术领域。本发明基于动态二叉树的SVM多分类方法利用多个二分类SVM构成二叉树结构的SVM多分类器,并在分类过程中根据各二分类SVM的分类结果动态调整二叉树结构,将分类成功率较高的二分类SVM调整至二叉树结构的根部,从而提高早期分类成功的概率,并且减少单个样本所经过的二分类SVM的数量,在保证分类准确率的同时有效提高了分类速度。本发明还公开了一种采用本发明多分类方法的网络告警预测方法、P2P流量分类方法、图像语义分类方法、网络攻击检测方法及网页分类方法。
申请公布号 CN102722726B 申请公布日期 2014.01.15
申请号 CN201210181550.9 申请日期 2012.06.05
申请人 江苏省电力公司南京供电公司;南京邮电大学 发明人 韦磊;朱红;程春玲;王亚石;隋宗见
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 杨楠
主权项 一种基于动态二叉树的SVM多分类方法,首先利用训练好的多个二分类SVM构造二叉树结构的SVM多分类器,然后利用所构造的SVM多分类器对测试样本集进行分类;其特征在于,所述利用所构造的SVM多分类器对测试样本集进行分类,具体包括以下步骤:步骤1、将测试样本集中的第一个测试样本输入所述SVM多分类器的根节点,并将SVM多分类器中各二分类SVM的调整因子初始化为0,所述调整因子的定义为该二分类SVM的分类成功次数与分类总次数的比值,分类成功次数为通过该二分类SVM并且输出结果为+1的测试样本的个数,分类总次数是指通过该二分类SVM的测试样本的总数;步骤2、如当前节点为空节点,则分类过程结束,转到步骤4,否则,转至步骤3;步骤3、用当前二分类SVM对待分类样本进行分类,如输出结果为‑1,则根据输出结果动态调整当前二分类SVM的调整因子,并将该测试样本输入给当前二分类SVM的子节点所对应的二分类SVM,然后转步骤2;若为+1,则根据输出结果动态调整当前二分类SVM的调整因子,分类过程结束,转至步骤4;步骤4、判断SVM多分类器中各二分类SVM的调整因子的最大值与最小值之间的比值是否大于一预设的调整阈值,如是,则按照以下方法重新调整所述SVM多分类器的二叉树结构:将调整因子值大的SVM向二叉树的根部位置调整,即调整因子最大的SVM作为根节点,次大的SVM作为根节点的子节点,以此类推,建立新的二叉树结构;如否,则保持二叉树的结构不变;步骤5、将测试样本集中的下一个测试样本输入所述SVM多分类器的根节点,并重复执行步骤2—步骤4,直至测试样本集中所有测试样本均完成分类。
地址 210019 江苏省南京市奥体大街1号