发明名称 基于随机子空间的高维数据软硬聚类集成方法
摘要 本发明公开一种基于随机子空间的高维数据软硬聚类集成方法,包括以下步骤为:(1)输入高维数据集;(2)数据归一化;(3)产生随机子空间;(4)kmeans和fuzzy cmeans聚类;(5)生成融合矩阵;(6)使用聚类有效性指标得出最优聚类数目;(7)构造决策属性集;(8)改进粗糙集属性约简,得到精简融合矩阵;(9)一致性函数划分;(10)聚类纯净率。本发明利用随机子空间解决了高维数据难处理的问题;利用软聚类和硬聚类的结合,充分利用原始数据和中间结果信息;并对中间结果冗余属性约简,在提高聚类准确率的同时也提高聚类速度;解决了现有技术中对聚类信息的充分利用以及冗余信息去除的问题。
申请公布号 CN106446947A 申请公布日期 2017.02.22
申请号 CN201610843524.6 申请日期 2016.09.22
申请人 华南理工大学 发明人 余志文;陈洁彦;马帅;韩国强
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 广州市华学知识产权代理有限公司 44245 代理人 李斌
主权项 一种基于随机子空间的高维数据软硬聚类集成方法,其特征在于,包括如下步骤:S1、输入高维数据集,将其进行归一化;S2、使归一化后的高维数据集产生随机子空间;S3、对子空间进行聚类,得到聚类结果矩阵;S4、将聚类结果矩阵进行合并,生成融合矩阵;S5、根据融合矩阵,使用聚类有效性指标得出最优聚类数目;S6、使用融合矩阵和最优聚类数目作为参数,构造决策属性集;S7、将融合矩阵作为条件属性集,根据决策属性集,对融合矩阵进行改进粗糙集属性约简,得到精简融合矩阵;S8、使用精简融合矩阵和真实聚类数目作为参数进行聚类,得到聚类结果矩阵,根据聚类结果矩阵确定最终聚类结果;S9、计算最终聚类结果与真实聚类结果的纯净率。
地址 510640 广东省广州市天河区五山路381号