发明名称 一种实现K‑means聚类的方法及装置
摘要 本申请公开了一种实现K‑means聚类的方法及装置,包括:对聚类数据进行随机抽样得到样本集,样本集与聚类数据满足预先设置的相似度数值;利用获得的样本集形成K个集群的层次聚类,将层次聚类的K个集群的质心作为K‑means聚类的初始质心;根据获取的K‑means初始质心进行K‑means聚类。本发明通过选取需要数量的聚类集样本进行层次聚类,以获取层次聚类的质心作为K‑means聚类方法的初始质心,使K‑means聚类方法不受初始质心影响。另一方面,通过聚类算法过程中不满足聚类第一数值的聚类进行删除,从最大的聚类开始拆分相应个数的聚类,以保证聚类要求的聚类集群的个数要求。
申请公布号 CN103744962B 申请公布日期 2017.01.25
申请号 CN201410005652.4 申请日期 2014.01.06
申请人 浪潮(北京)电子信息产业有限公司 发明人 李傲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京安信方达知识产权代理有限公司 11262 代理人 王丹;栗若木
主权项 一种实现K‑means聚类的方法,其特征在于,包括:对聚类数据进行随机抽样得到样本集,样本集与聚类数据满足预先设置的相似度数值;利用获得的样本集形成K个集群的层次聚类,将层次聚类的K个集群的质心作为K‑means聚类的初始质心;根据获取的K‑means初始质心进行K‑means聚类;所述满足预先设置的相似度数值为:预先设置相似度数值,通过计算公式(1‑(1‑1/K)<sup>s</sup>)<sup>K</sup>的数值大于或等于预先设置的相似度数值,获得样本集的样本数值;其中,S为需要计算的样本集的样本数值。
地址 100085 北京市海淀区上地信息路2号2-1号C栋1层