一种MapReduce平台上的海量高维数据聚类方法,申请号CN201110148982.5-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种MapReduce平台上的海量高维数据聚类方法
摘要	本发明属于云计算与数据挖掘技术领域，具体为一种MapReduce平台上的海量高维数据聚类方法。该方法首先对原始数据的每一维进行分割，用切分好的非空小格代替原数据中的点集进行聚类，减小数据规模。利用MapReduce的开源实现，使得聚类过程可以在分布式集群上并行完成，克服了单机算法在存储和计算上的限制。聚类过程采用K-mediods算法的思想，并提出高效的欧式距离计算方法。本发明适用于处理海量高维数据，用户可以根据集群的计算能力、算法的时间期望以及对聚类精确性的要求对算法进行手动调整，满足了不同用户的需要。
申请公布号	CN102222092A	申请公布日期	2011.10.19
申请号	CN201110148982.5	申请日期	2011.06.03
申请人	复旦大学	发明人	廖松博;何震瀛;汪卫
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	上海正旦专利代理有限公司 31200	代理人	陆飞;盛志范
主权项	一种MapReduce平台上的海量高维数据聚类方法，其特征在于具体步骤如下：（1）对于输入的海量高维数据进行预处理，设高维数据为D维，首先是对原数据各维进行标准化，之后将每一维切成N格，生成非空的D维格子集合；（2）以步骤(1)输出的结果作为输入，实现MapReduce平台上的K‑mediods并行算法，通过迭代计算对D维格子集合进行聚类；（3）将步骤(2)得出的D维格子聚类的结果还原成原始的D维点集聚类结果，并按照用户的需求进行最终整理及输出。
地址	200433 上海市杨浦区邯郸路220号

您可能感兴趣的专利

METHOD AND DEVICE OF HOLEELESS DIE CASTING

TEMPER TYPE HIGH TENSILE STEEL SUPERIOR IN WELDABILITY

EQUIISPEED DROPPING MACHINE

VERFAHREN ZUM AUFHELLEN VON ROHEN BASTFASERN

ARBEITSMOEBEL, INSBESONDERE FUER DIE ZAHNAERZTLICHE PRAXIS

ARMATURE METALLIQUE COMPOSEE ET ADHERENTE POUR BETON ARME

DRUCKANZEIGEVORRICHTUNG

PROCEDE D'ECHANGE D'IONS POUR LA PURIFICATION DE SOLUTIONS ELECTROLYTIQUES DE METAUX COMMUNS

PROCEDE DE PREPARATION DU SULFATE DE L'OCTAPEPTIDAMIDE DE LA CHOLECYSTOKININE-PANCREOZYMINE

PROCEDE ET DISPOSITIF DE TRANSFERT ELECTROSTATIQUE D'UNE IMAGE DE TONER DEPUIS UNE SURFACE D'ENREGISTREMENT CURVILIGNE SUR UNE MATIERE SUPPORT

TEIGKNETMASCHINE

VERFAHREN ZUM HERSTELLEN VON GEGENEINANDER ELEKTRISCH ISOLIERTEN, AUS ALUMINIUM BESTEHENDEN LEITERBAHNEN UND ANWENDUNG DES VERFAHRENS

PRESSE MECANIQUE SUR LAQUELLE LA DISTANCE ENTRE LE COULISSEAU ET LA TABLE EST REGLABLE

ETIQUETEUSE EQUIPEE D'ELEMENTS DE PRELEVEMENT A COMMANDE ACCELEREE ET RETARDEE

CATALYST COMPONENTS USEFUL TO POLYMERIZE ALPHA-OLEFINS AND CATALYSTS OBTAINED THE REFORM

PURINES SUBSTITUEES

SKIBINDUNG FUER NACHGIEBIGE SCHUHE

FLUGTRAININGSHAUBE