发明名称 一种在信息检索中基于图中的块结构来计算网页结构图中的链接相似度的系统和方法
摘要 一种基于图中的块结构来计算链接相似度的系统和方法,其中该方法包括步骤:输入一个图结构;对该图结构中的块结构进行侦测;通过迭代来计算块间节点相似度;当相邻两次计算的结果收敛,或其接近程度已经达到用户的要求,终止迭代循环过程。本发明可在时间复杂度上有显著的降低。
申请公布号 CN101576905B 申请公布日期 2011.05.04
申请号 CN200910078788.7 申请日期 2009.03.03
申请人 杜小勇 发明人 杜小勇;刘红岩;何军;李佩;蔡元哲
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京中创阳光知识产权代理有限责任公司 11003 代理人 尹振启
主权项 一种在信息检索中基于图中的块结构来计算网页结构图中的节点间相似度的方法,包括步骤:A、输入一个图结构;B、对该图结构中的块结构进行侦测,所述块结构是一种具有块间松散,块内密集的子图;对图结构中的块结构进行侦测,具体是将对应的整体的图划分为子图,在给定子图个数的情况下,使子图间的边数最少;C、通过迭代来计算块间节点相似度,具体步骤为:C1、计算块的相似度;C2、计算块内节点相似度;C3、计算节点与所在块之间的距离;C4、利用在步骤C1中计算的块的相似度和在步骤C3中计算的节点与所在块间的距离来计算不同块之间的节点的相似度;C5、对步骤C2所计算的块内节点相似度和步骤C4所计算的块间节点相似度进行组装以得到图中节点间的全局相似度;D、当相邻两次计算的结果收敛,或其接近程度已经达到用户的要求,终止迭代循环过程。
地址 100872 北京市海淀区中关村大街59号中国人民大学信息学院