发明名称 一种基于深度学的聚类方法
摘要 本发明公开了一种基于深度学的聚类方法,该方法包括以下步骤:得到深度神经网络的初始网络权重;对样本进行随机分组并映射到特征空间;将原始深度神经网络的目标函数加入特征层的类内约束函数;更新深度神经网络的网络权重,计算得到新的特征层;将每个样本分配至最近聚类中心所在的类组,计算新的聚类中心;以新的聚类中心代替类内约束函数的聚类中心,返回网络权重更新步骤进行迭代,得到并输出最终聚类分组结果。本发明将样本从不易聚类的原始数据空间,通过深度神经网络的非线性映射,得到高度可分的特征用于聚类,并且可以不断优化网络结构得到更好的聚类效果,本发明以较小的内存消耗以及较高的聚类精度优于常规聚类算法。
申请公布号 CN103530689A 申请公布日期 2014.01.22
申请号 CN201310530626.9 申请日期 2013.10.31
申请人 中国科学院自动化研究所 发明人 谭铁牛;王亮;黄永祯;宋纯锋
分类号 G06N3/08(2006.01)I;G06K9/62(2006.01)I 主分类号 G06N3/08(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于深度学习的大规模聚类方法,其特征在于,该方法包括以下步骤:步骤S1,对于一样本集合,得到深度神经网络的初始网络权重;步骤S2,对所述样本集合中所有的样本进行随机分组,得到所述样本集合的初始聚类分组,并为每个样本分配初始聚类标签;步骤S3,将所述样本集合中所有的样本通过所述深度神经网络映射到特征空间,并计算所有初始聚类分组的平均值,作为相应聚类分组的新的聚类中心;步骤S4,将原始深度神经网络的目标函数加入特征层的类内约束函数,得到新的深度神经网络,使得每个聚类分组中的所有样本在特征层与所述新的聚类中心的距离最小;步骤S5,利用所述步骤S4得到的新的深度神经网络更新其网络权重;步骤S6,利用所述步骤S5得到的更新网络权重后的深度神经网络,计算得到新的特征层,并基于此与之前的所有聚类中心进行比较,将每个样本分配至与其距离最近的聚类中心所在的类组,并为每个样本分配新的聚类标签;步骤S7,对于所述步骤S6中得到的新的聚类分组计算每个分组的均值作为新的聚类中心;步骤S8,以所述步骤S7中得到的新的聚类中心代替所述步骤S4中类内约束函数的聚类中心;步骤S9,返回所述步骤S5进行迭代,直到聚类效果达到最优或者满足迭代次数要求,得到并输出最终聚类分组结果。
地址 100190 北京市海淀区中关村东路95号