发明名称 一种基于数据特征的智能信息分类方法
摘要 本发明属于数据挖掘领域,涉及一种基于数据特征的智能信息分类方法。本发明主要包括对已经标记好的网页进行训练和对待分类网页进行分类两个阶段。训练阶段包括的主要步骤有:对网页进行预处理;对网页正文进行中文分词和去停止词;根据数据特征创建知识库;对网页进行特征选择和生成特征向量;生成SVM分类器。分类阶段的主要步骤有:对网页进行预分类;用SVM分类器进行精确分类。通过本发明,解决了现有信息分类方法无法对中文网页进行高速和高效分类的不足。
申请公布号 CN105447161A 申请公布日期 2016.03.30
申请号 CN201510866092.6 申请日期 2015.11.26
申请人 广东工业大学 发明人 刘治;张胜;章云
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于数据特征的智能信息分类方法,其特征在于,该方法包括:根据数据特征创建知识库,对待分类的中文网页进行预分类,大大加速了网页的分类速度。
地址 510006 广东省广州市番禺区广州大学城外环西路100号广东工业大学