发明名称 一种基于L2稀疏限制的特征加权k‑means聚类方法
摘要 一种基于L2稀疏限制的特征加权k‑means聚类方法,包含以下步骤:(1)预处理,把每个数据对象表示成一个特征向量,同时随机初始化分配矩阵、簇中心和权向量,并归一化权向量;(2)计算分配矩阵,计算每个对象与每个簇中心的带权距离,把对象分配到与之具有最小带权距离的簇中;(3)计算簇中心,根据当前分配矩阵计算每个簇的中心;(4)计算特征权重,根据簇内散度和稀疏参数计算每个特征的权重。循环步骤(2)到(4),直到算法收敛。本发明所述方法设计了一种能够集成簇内散度和L2稀疏限制的新目标函数,通过求解目标函数获得各求解步骤和特征权重,通过特征权重鉴别出不同特征的作用,从而提高聚类的性能。
申请公布号 CN106469318A 申请公布日期 2017.03.01
申请号 CN201610864968.8 申请日期 2016.09.30
申请人 华东交通大学 发明人 黄晓辉
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南昌市平凡知识产权代理事务所 36122 代理人 姚伯川
主权项 一种基于L2稀疏限制的特征加权k‑means聚类方法,其特征在于,所述方法包括以下步骤:(1)预处理:把数据集中每个数据对象表示成一个特征向量,即X={x<sub>1</sub>,x<sub>2</sub>,...,x<sub>n</sub>},n为数据对象数目;同时,随机初始化数据对象分配矩阵U,簇中心Z和权重W,并且针对每一个簇归一化其特征权向量;(2)计算数据对象分配矩阵:在给定簇中心Z和特征权重W的情况下,针对每个数据对象,计算该数据对象与每个簇中心的带权距离,并将该数据对象分配到与之具有最小带权距离的簇中;(3)计算簇中心:在给定数据对象分配矩阵U的情况下,针对每个簇中的每个特征计算其算术平均作为簇中心;(4)计算特征权重W:在给定分配矩阵U和簇中心Z的情况下,针对每个簇计算一个特征向量;这个步骤中,首先需要针对每个簇的每个特征计算其散度值;然后根据散度和稀疏参数计算一个阀值;最后根据散度、稀疏参数和阀值计算簇中每个特征的权重;(5)迭代步骤(2)、(3)和(4),直到算法收敛;通过目标函数值判定算法是否收敛,在算法收敛后,聚类结果保存在分配矩阵U中,而特征权重W用来表示簇中每个特征在簇中的重要性。
地址 330013 江西省南昌市经济技术开发区双港东大街808号