发明名称 聚类分析方法、装置及设备
摘要 本公开是关于一种聚类分析方法、装置及设备,属于数据处理技术领域。方法包括:对于待聚合类中的第一类和第二类,计算所述第一类和所述第二类中两两样本之间的距离;将得到的样本距离按照预定顺序进行排序,确定指定数目个样本距离,所述指定数目根据所述第一类或所述第二类的类内聚合度调整得到;根据所述指定数目个样本距离,计算所述第一类和所述第二类的类间距离;根据所述待聚合类中每两个类之间的类间距离,对所述待聚合类进行聚类。由于基于类的形状自适应地调整了指定数目的大小,并基于该指定数目确定了计算类间距离所使用的样本距离基数,所以得到的计算结果较为精准,不易受异常数据和噪声等的影响。在进行聚类时,聚类效果较好。
申请公布号 CN104598544A 申请公布日期 2015.05.06
申请号 CN201410852005.7 申请日期 2014.12.31
申请人 小米科技有限责任公司 发明人 陈志军;张涛;关亚勇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 祝亚男
主权项 一种聚类分析方法,其特征在于,所述方法包括:对于待聚合类中的第一类和第二类,计算所述第一类和所述第二类中两两样本之间的距离,所述两两样本中一个样本来自于所述第一类,另一个样本来自于所述第二类;将得到的样本距离按照预定顺序进行排序,确定指定数目个样本距离,所述指定数目根据所述第一类或所述第二类的类内聚合度调整得到;根据所述指定数目个样本距离,计算所述第一类和所述第二类的类间距离;根据所述待聚合类中每两个类之间的类间距离,对所述待聚合类进行聚类。
地址 100085 北京市海淀区清河中街68号华润五彩城购物中心二期13层