发明名称 |
基于冗余距离消除和极端点优化的并行k-means聚类方法 |
摘要 |
本发明公开了一种基于冗余距离消除和极端点优化的并行k‑means聚类方法,使用正弦定理和余弦定理,找出每个聚类中的冗余距离并消除每个聚类中的冗余距离;对极端点与其相应的中心点之间距离采用曼哈顿距离进行计算;在迭代过程中,采用平均值的计算方式选取K‑means聚类方法中的中心点。本发明找出每个聚类中的冗余距离,然后避免聚类中的点与不相关的中心点做距离计算,让K‑means方法在目前的情况下更大程度的消除冗余距离计算;进行优化极端点的处理,对极端点采用曼哈顿距离代替欧氏距离来计算极端点与中心点之间的距离;最后,中心点的选取方式,采用平均值的计算方式代替随机选取的方式,使得聚类中的点分布的更均匀,聚类结果更精确。 |
申请公布号 |
CN105740604A |
申请公布日期 |
2016.07.06 |
申请号 |
CN201610044881.6 |
申请日期 |
2016.01.22 |
申请人 |
湖南大学 |
发明人 |
李肯立;肖锦波;唐卓;刘锡洋;鲁彬;陈俊杰 |
分类号 |
G06F19/00(2011.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F19/00(2011.01)I |
代理机构 |
深圳市兴科达知识产权代理有限公司 44260 |
代理人 |
王翀 |
主权项 |
一种基于冗余距离消除和极端点优化的并行k‑means聚类方法,其特征在于,使用正弦定理和余弦定理,找出每个聚类中的冗余距离并消除每个聚类中的冗余距离;对极端点与极端点所在聚类的中心点之间距离采用曼哈顿距离进行计算;在迭代过程中,采用平均值的计算方式选取K‑means聚类方法中的中心点。 |
地址 |
410082 湖南省长沙市岳麓区麓山南路1号 |