发明名称 |
聚类分析方法、装置及设备 |
摘要 |
本公开是关于一种聚类分析方法、装置及设备,属于数据处理技术领域。方法包括:对于待聚合类中的第一类和第二类,计算所述第一类和所述第二类中两两样本之间的距离;将得到的样本距离按照预定顺序进行排序,确定指定数目个样本距离,所述指定数目根据所述第一类或所述第二类的类内聚合度调整得到;根据所述指定数目个样本距离,计算所述第一类和所述第二类的类间距离;根据所述待聚合类中每两个类之间的类间距离,对所述待聚合类进行聚类。由于基于类的形状自适应地调整了指定数目的大小,并基于该指定数目确定了计算类间距离所使用的样本距离基数,所以得到的计算结果较为精准,不易受异常数据和噪声等的影响。在进行聚类时,聚类效果较好。 |
申请公布号 |
CN104598544A |
申请公布日期 |
2015.05.06 |
申请号 |
CN201410852005.7 |
申请日期 |
2014.12.31 |
申请人 |
小米科技有限责任公司 |
发明人 |
陈志军;张涛;关亚勇 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京三高永信知识产权代理有限责任公司 11138 |
代理人 |
祝亚男 |
主权项 |
一种聚类分析方法,其特征在于,所述方法包括:对于待聚合类中的第一类和第二类,计算所述第一类和所述第二类中两两样本之间的距离,所述两两样本中一个样本来自于所述第一类,另一个样本来自于所述第二类;将得到的样本距离按照预定顺序进行排序,确定指定数目个样本距离,所述指定数目根据所述第一类或所述第二类的类内聚合度调整得到;根据所述指定数目个样本距离,计算所述第一类和所述第二类的类间距离;根据所述待聚合类中每两个类之间的类间距离,对所述待聚合类进行聚类。 |
地址 |
100085 北京市海淀区清河中街68号华润五彩城购物中心二期13层 |