发明名称 | 一种基于扩展熵信息瓶颈理论的聚类方法 | ||
摘要 | 本发明公开了一种基于扩展熵信息瓶颈理论的聚类方法,主要是针对数据挖掘中无监督聚类问题,当聚类数组之间关系复杂而又无法用统计概率描述的数组集合聚类问题,该方法既可以体现数组之间复杂的相关性,又可以体现数组对应位置之间的对应关系,而且该聚类方法可以提供一个客观的聚类截尾准则,有效避免由主观指定聚类个数的缺陷。该聚类方法可以广泛应用于医学、智能交通、模式识别等领域的聚类问题。 | ||
申请公布号 | CN101655847A | 申请公布日期 | 2010.02.24 |
申请号 | CN200810139542.1 | 申请日期 | 2008.08.22 |
申请人 | 山东省计算中心 | 发明人 | 孙占全 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 代理人 | ||
主权项 | 1、一种基于扩展熵信息瓶颈理论的聚类方法,其特征在于,包括步骤:根据样本确定聚类数组及数组的取值,计算每个取值的比值;用比值代替概率计算聚类数组的扩展熵;确定数组合并后联合扩展熵的计算形式;根据信息瓶颈理论选择信息损失量最小的聚类数组进行合并,生成一个新的数组;以聚类产生的信息损失量变化率作为确定聚类结束的标准,即获得最终的聚类结果。 | ||
地址 | 250014山东省济南市科院路19号 |