发明名称 |
基于局部迭代的MapReduce模型的图结点的权威值计算方法 |
摘要 |
本发明提供一种基于局部迭代的MapReduce模型的图结点的权威值计算方法,包括:数据预处理与子图划分,采取随机的划分方式和基于社团结构的划分方式来进行子图的划分;迭代执行MapReduce任务进行PageRank计算,Map阶段对各个子图进行独立的基于内存的PageRank计算,Reduce阶段reduce函数将各个子图产生的新的权威值按照结点ID进行归约求和,得到最终的结点的权威值;算法收敛检测。本方法既保留了内存算法的高效性,又得益于MapReduce处理海量数据的可扩展性,高可用性和容错性。 |
申请公布号 |
CN103793525A |
申请公布日期 |
2014.05.14 |
申请号 |
CN201410060170.9 |
申请日期 |
2014.02.21 |
申请人 |
江苏唯实科技有限公司 |
发明人 |
王文 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
无锡市大为专利商标事务所(普通合伙) 32104 |
代理人 |
曹祖良 |
主权项 |
一种基于局部迭代的MapReduce模型的图结点的权威值计算方法,其特征在于,包括下述步骤:步骤a,数据预处理与子图划分,采取随机的划分方式和基于社团结构的划分方式来进行子图的划分;步骤b,迭代执行MapReduce任务进行PageRank计算,Map阶段对各个子图进行独立的基于内存的PageRank计算,Reduce阶段reduce函数将各个子图产生的新的权威值按照结点ID进行归约求和,得到最终的结点的权威值;步骤c,算法收敛检测,当数据集中的超过给定阈值的结点的权威值不再发生变化时,即算法收敛。 |
地址 |
214028 江苏省无锡市新区国家软件园三期鲸鱼座C幢10楼 |