发明名称 一种决策级文本自动分类融合方法
摘要 本发明涉及一种决策级文本自动分类融合方法,属于数据挖掘领域,适用于数字图书馆、网络内容监管、垃圾邮件过滤等。本发明以信息融合为理论基础,以分类精度高的文本自动分类算法为研究对象,建立了决策级文本自动分类融合模型,即采用多层融合结构,串、并联混和的形式进行文本自动分类处理,得到准确率更高的分类结果。
申请公布号 CN101604322B 申请公布日期 2011.09.07
申请号 CN200910087844.3 申请日期 2009.06.24
申请人 北京理工大学 发明人 张晓丹;牛振东;张正施;曹玉鹃;徐小梅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京理工大学专利中心 11120 代理人 张利萍
主权项 一种决策级文本自动分类融合方法,其特征在于以信息融合为理论基础,以分类精度高的文本自动分类算法为研究对象,建立了决策级文本自动分类融合模型,即采用多层融合结构,串、并联混和的形式进行文本自动分类处理,得到准确率更高的分类结果;其具体实现步骤如下:第1步:对待分文档进行分词、特征提取、权重计算预处理;第2步:在第1步的基础上,将预处理后的结果分别发送到SVM,KNN和贝叶斯分类器中;第3步:在第2步的基础上,SVM分类器进行分类,并将分类结果发送到决策级融合中心以及KNN分类器中;第4步:在第2步的基础上,KNN分类器进行分类,得到KNN分类器的分类结果;第5步:在第3步和第4步的基础上,将KNN分类器的分类结果与SVM的分类结果进行比较,即:将KNN得到类别概率与SVM分类器的分类结果进行比较,概率最大者为该分类器的最终分类结果;然后将分类结果发送到决策级融合中心以及贝叶斯分类器中;第6步:在第2步的基础上,贝叶斯分类器进行分类,得到贝叶斯分类器的分类结果;第7步:在第5步和第6步的基础上,将贝叶斯分类器的分类结果与KNN的分类结果相比较,即:将贝叶斯分类器得到的类别概率与KNN分类器的分类结果进行比较,概率最大者为该分类器的最终分类结果;将分类结果发送到决策级分类融合中心;第8步:在第3步、第5步和第7步的基础上,在决策级融合中心采用投票算法对特征级得到的分类结果进行投票,得到最终的分类决策结果。
地址 100081 北京市海淀区中关村南大街5号