发明名称 计算机文本的特征选择方法、分类特征选择方法及系统
摘要 本发明涉及一种计算机文本的特征选择方法、分类特征选择方法及系统,计算机文本的特征选择方法包括如下步骤:步骤S1,对计算机文本进行处理,得到文本的三维特征数据集;步骤S2,计算所述文本的三维特征数据集的重构系数矩阵,并且计算信息熵向量;步骤S3,按照所述信息熵向量以及所述重构系数矩阵计算综合度量指标,并且按照所述综合度量指标从小到大的顺序进行特征选择;以及步骤S4,输出经过特征选择获得的文本特征集。本发明的特征选择方法不仅能够降低文本特征空间的维数,以利于提高文本分类的效率,而且通过删除对文本分类冗余和不相关的特征,有利于提高文本分类的分类精度。
申请公布号 CN106503146A 申请公布日期 2017.03.15
申请号 CN201610919741.9 申请日期 2016.10.21
申请人 江苏理工学院 发明人 钱进;吕萍
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 重庆百润洪知识产权代理有限公司 50219 代理人 刘岩
主权项 一种计算机文本的特征选择方法,其特征在于,包括如下步骤:步骤S1,对计算机文本进行处理,得到文本的三维特征数据集;步骤S2,计算所述文本的三维特征数据集的重构系数矩阵,并且计算信息熵向量;步骤S3,按照所述信息熵向量以及所述重构系数矩阵计算综合度量指标,并且按照所述综合度量指标从小到大的顺序进行特征选择;以及步骤S4,输出经过特征选择获得的文本特征集。
地址 213001 江苏省常州市钟楼区中吴大道1801号