发明名称 |
一种实现K‑means聚类的方法及装置 |
摘要 |
本申请公开了一种实现K‑means聚类的方法及装置,包括:对聚类数据进行随机抽样得到样本集,样本集与聚类数据满足预先设置的相似度数值;利用获得的样本集形成K个集群的层次聚类,将层次聚类的K个集群的质心作为K‑means聚类的初始质心;根据获取的K‑means初始质心进行K‑means聚类。本发明通过选取需要数量的聚类集样本进行层次聚类,以获取层次聚类的质心作为K‑means聚类方法的初始质心,使K‑means聚类方法不受初始质心影响。另一方面,通过聚类算法过程中不满足聚类第一数值的聚类进行删除,从最大的聚类开始拆分相应个数的聚类,以保证聚类要求的聚类集群的个数要求。 |
申请公布号 |
CN103744962B |
申请公布日期 |
2017.01.25 |
申请号 |
CN201410005652.4 |
申请日期 |
2014.01.06 |
申请人 |
浪潮(北京)电子信息产业有限公司 |
发明人 |
李傲 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京安信方达知识产权代理有限公司 11262 |
代理人 |
王丹;栗若木 |
主权项 |
一种实现K‑means聚类的方法,其特征在于,包括:对聚类数据进行随机抽样得到样本集,样本集与聚类数据满足预先设置的相似度数值;利用获得的样本集形成K个集群的层次聚类,将层次聚类的K个集群的质心作为K‑means聚类的初始质心;根据获取的K‑means初始质心进行K‑means聚类;所述满足预先设置的相似度数值为:预先设置相似度数值,通过计算公式(1‑(1‑1/K)<sup>s</sup>)<sup>K</sup>的数值大于或等于预先设置的相似度数值,获得样本集的样本数值;其中,S为需要计算的样本集的样本数值。 |
地址 |
100085 北京市海淀区上地信息路2号2-1号C栋1层 |