发明名称 一种基于离群指数的初始聚类中心优选算法
摘要 本发明涉及一种聚类算法,具体涉及一种基于离群指数的初始聚类中心优选算法。包括如下步骤:(1)计算局部离群指数;(2)得到处于密集区域的数据对象集合D;(3)将局部离群指数最小的数据加入初始聚类中心集合;在集合D中找出距离O<sub>1</sub>点最远的点O<sub>2</sub>作为第二个聚类中心,加入初始聚类中心集合,并从D中删除O<sub>1</sub>、O<sub>2</sub>;(4)从集合D中找出O<sub>3</sub>和O<sub>1</sub>、O<sub>2</sub>和O<sub>3</sub>的距离之和最大,然后将O<sub>3</sub>加入到初始聚类中心集合,将O<sub>3</sub>从集合D中删除,继续从集合D中找出到初始聚类中心对象集合中所有对象距离最远的点作为聚类中心,直到第k个;(5)运用K‐均值聚类算法对整个数据集进行聚类。本发明简单、快速、应用广泛。
申请公布号 CN104317824A 申请公布日期 2015.01.28
申请号 CN201410523697.0 申请日期 2014.10.08
申请人 陕西高新实业有限公司 发明人 王耀斌
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 西安亿诺专利代理有限公司 61220 代理人 贾苗苗
主权项 一种基于离群指数的初始聚类中心优选算法,其特征在于:采用如下步骤:输入:具有n 个对象的数据集X和聚类分组数k ;输出:k 个聚类,使得目标函数E 最小;步骤1:计算每个数据对象的局部离群指数;步骤2:将局部离群指数排在前n 个的数据对象点删除,得到处于密集区域的数据对象集合D;步骤3:将局部离群指数最小的数据对象作为第一个聚类中心O<sub>1</sub>,将O<sub>1</sub>加入初始聚类中心集合;在集合D 中找出距离O<sub>1</sub>点最远的点O<sub>2</sub>作为第二个聚类中心,加入初始聚类中心集合,并从D中删除O<sub>1</sub>、O<sub>2</sub>;步骤4:从集合D中找出O<sub>3</sub> 和O<sub>1</sub>、O<sub>2</sub>和O<sub>3</sub>的距离之和最大,然后将O<sub>3</sub>加入到初始聚类中心集合,将O<sub>3</sub>从集合D中删除,继续从集合D 中找出到初始聚类中心对象集合中所有对象距离最远的点作为聚类中心,直到第k个;步骤5:用得到的k个聚类中心,运用K‐均值聚类算法对整个数据集进行聚类。
地址 710000 陕西省西安市高新开发区高新路枫叶大厦C502
您可能感兴趣的专利