发明名称 |
计算机文本的特征选择方法、分类特征选择方法及系统 |
摘要 |
本发明涉及一种计算机文本的特征选择方法、分类特征选择方法及系统,计算机文本的特征选择方法包括如下步骤:步骤S1,对计算机文本进行处理,得到文本的三维特征数据集;步骤S2,计算所述文本的三维特征数据集的重构系数矩阵,并且计算信息熵向量;步骤S3,按照所述信息熵向量以及所述重构系数矩阵计算综合度量指标,并且按照所述综合度量指标从小到大的顺序进行特征选择;以及步骤S4,输出经过特征选择获得的文本特征集。本发明的特征选择方法不仅能够降低文本特征空间的维数,以利于提高文本分类的效率,而且通过删除对文本分类冗余和不相关的特征,有利于提高文本分类的分类精度。 |
申请公布号 |
CN106503146A |
申请公布日期 |
2017.03.15 |
申请号 |
CN201610919741.9 |
申请日期 |
2016.10.21 |
申请人 |
江苏理工学院 |
发明人 |
钱进;吕萍 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
重庆百润洪知识产权代理有限公司 50219 |
代理人 |
刘岩 |
主权项 |
一种计算机文本的特征选择方法,其特征在于,包括如下步骤:步骤S1,对计算机文本进行处理,得到文本的三维特征数据集;步骤S2,计算所述文本的三维特征数据集的重构系数矩阵,并且计算信息熵向量;步骤S3,按照所述信息熵向量以及所述重构系数矩阵计算综合度量指标,并且按照所述综合度量指标从小到大的顺序进行特征选择;以及步骤S4,输出经过特征选择获得的文本特征集。 |
地址 |
213001 江苏省常州市钟楼区中吴大道1801号 |