一种决策级文本自动分类融合方法,申请号CN200910087844.3-传众专利搜索

发明名称	一种决策级文本自动分类融合方法
摘要	本发明涉及一种决策级文本自动分类融合方法，属于数据挖掘领域，适用于数字图书馆、网络内容监管、垃圾邮件过滤等。本发明以信息融合为理论基础，以分类精度高的文本自动分类算法为研究对象，建立了决策级文本自动分类融合模型，即采用多层融合结构，串、并联混和的形式进行文本自动分类处理，得到准确率更高的分类结果。
申请公布号	CN101604322B	申请公布日期	2011.09.07
申请号	CN200910087844.3	申请日期	2009.06.24
申请人	北京理工大学	发明人	张晓丹;牛振东;张正施;曹玉鹃;徐小梅
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	北京理工大学专利中心 11120	代理人	张利萍
主权项	一种决策级文本自动分类融合方法，其特征在于以信息融合为理论基础，以分类精度高的文本自动分类算法为研究对象，建立了决策级文本自动分类融合模型，即采用多层融合结构，串、并联混和的形式进行文本自动分类处理，得到准确率更高的分类结果；其具体实现步骤如下：第1步：对待分文档进行分词、特征提取、权重计算预处理；第2步：在第1步的基础上，将预处理后的结果分别发送到SVM，KNN和贝叶斯分类器中；第3步：在第2步的基础上，SVM分类器进行分类，并将分类结果发送到决策级融合中心以及KNN分类器中；第4步：在第2步的基础上，KNN分类器进行分类，得到KNN分类器的分类结果；第5步：在第3步和第4步的基础上，将KNN分类器的分类结果与SVM的分类结果进行比较，即：将KNN得到类别概率与SVM分类器的分类结果进行比较，概率最大者为该分类器的最终分类结果；然后将分类结果发送到决策级融合中心以及贝叶斯分类器中；第6步：在第2步的基础上，贝叶斯分类器进行分类，得到贝叶斯分类器的分类结果；第7步：在第5步和第6步的基础上，将贝叶斯分类器的分类结果与KNN的分类结果相比较，即：将贝叶斯分类器得到的类别概率与KNN分类器的分类结果进行比较，概率最大者为该分类器的最终分类结果；将分类结果发送到决策级分类融合中心；第8步：在第3步、第5步和第7步的基础上，在决策级融合中心采用投票算法对特征级得到的分类结果进行投票，得到最终的分类决策结果。
地址	100081 北京市海淀区中关村南大街5号