发明名称 基于局部迭代的MapReduce模型的图结点的权威值计算方法
摘要 本发明提供一种基于局部迭代的MapReduce模型的图结点的权威值计算方法,包括:数据预处理与子图划分,采取随机的划分方式和基于社团结构的划分方式来进行子图的划分;迭代执行MapReduce任务进行PageRank计算,Map阶段对各个子图进行独立的基于内存的PageRank计算,Reduce阶段reduce函数将各个子图产生的新的权威值按照结点ID进行归约求和,得到最终的结点的权威值;算法收敛检测。本方法既保留了内存算法的高效性,又得益于MapReduce处理海量数据的可扩展性,高可用性和容错性。
申请公布号 CN103793525A 申请公布日期 2014.05.14
申请号 CN201410060170.9 申请日期 2014.02.21
申请人 江苏唯实科技有限公司 发明人 王文
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 无锡市大为专利商标事务所(普通合伙) 32104 代理人 曹祖良
主权项 一种基于局部迭代的MapReduce模型的图结点的权威值计算方法,其特征在于,包括下述步骤:步骤a,数据预处理与子图划分,采取随机的划分方式和基于社团结构的划分方式来进行子图的划分;步骤b,迭代执行MapReduce任务进行PageRank计算,Map阶段对各个子图进行独立的基于内存的PageRank计算,Reduce阶段reduce函数将各个子图产生的新的权威值按照结点ID进行归约求和,得到最终的结点的权威值;步骤c,算法收敛检测,当数据集中的超过给定阈值的结点的权威值不再发生变化时,即算法收敛。
地址 214028 江苏省无锡市新区国家软件园三期鲸鱼座C幢10楼