发明名称 一种基于引用传播网络的作者影响力计算方法
摘要 本发明公开了一种基于引用传播网络的作者影响力计算方法,包括以下步骤:步骤1:建立引用关系网络和同事关系网络:基于论文公共信息数据库构造作者引用关系网络和同事关系网络;步骤2:建立引用传播网络:引用传播网络为作者引用关系网络和同事关系网络的融合网络;步骤3:基于引用传播网络计算作者的影响力Influence:计算公式为<img file="DDA0000677974090000011.GIF" wi="595" he="123" />该基于引用传播网络的作者影响力计算方法得到的作者影响力指标更合理,且易于实施,计算简便。
申请公布号 CN104657488B 申请公布日期 2016.03.02
申请号 CN201510097738.9 申请日期 2015.03.05
申请人 中南大学 发明人 龙军;刘旭;黄芳;赵贵虎
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 长沙市融智专利事务所 43114 代理人 黄美成
主权项 一种基于引用传播网络的作者影响力计算方法,其特征在于,包括以下步骤:步骤1:建立引用关系网络和同事关系网络:基于论文公共信息数据库构造作者引用关系网络和同事关系网络;步骤2:建立引用传播网络:引用传播网络为作者引用关系网络和同事关系网络的融合网络;首先以引用关系网络为基础,遍历分析引用关系,然后,获取存在引用关系的作者之间存在的同事关系,按照引用关系双方的同事关系远近,计算引用传播网络中作者的引用传播距离;并整合到引用关系的属性值中,得到引用传播网络;引用关系的属性值包括(1)作者k和j之间的引用传播距离值、(2)作者k和j之间的存在的论文引用记录以及(3)每一次引用的属性,即该次引用是自引用还是非自引用;步骤3:基于引用传播网络计算作者的影响力Influence:计算公式为<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>I</mi><mi>n</mi><mi>f</mi><mi>l</mi><mi>u</mi><mi>e</mi><mi>n</mi><mi>c</mi><mi>e</mi><mo>=</mo><mi>&Sigma;</mi><mrow><mo>(</mo><mfrac><msub><mi>D</mi><mrow><mi>s</mi><mi>r</mi></mrow></msub><msub><mi>D</mi><mrow><mi>s</mi><mi>m</mi><mi>a</mi><mi>x</mi></mrow></msub></mfrac><mi>&Sigma;</mi><mi>&lambda;</mi><mi>i</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000781155630000011.GIF" wi="605" he="135" /></maths>其中,λi为引用变量,若引用关系为自引用,则记λi为0.5,反之记为1;D<sub>sr</sub>表示在引用传播网络中作者引用关系的传播距离;D<sub>smax</sub>表示在引用传播网络中所有作者引用关系的传播距离中的最大值;在论文公共信息数据库中提取论文信息,论文信息包括论文名、作者、作者机构、发表时间和参考文献,采用Neo4j图数据库进行存储获取的所述论文信息;若一篇文章与该文章引用的文章没有相同的作者,则该次引用为非自引用,若该2篇文章有共同的作者,即至少有一个作者相同,则该次引用为自引用;通过以下cypher语句求得A和B两个作者之间的最短路径;Start n=node(“A”),m=node(“B”)match p=shortestPath(n‑[r:coWorkRelation*..]‑m)return p;p为最短路径;如果最短路径p存在,则该2个作者在同事关系网络中的关系最短路径距离长度sprDistance=p.length;如果求得的最短路径不存在,即两作者之间在同事关系网络中不存在可达路径,那么记sprDistance=‑1;最终形成作者关系距离关系表;对作者关系距离关系表中的数据进行以下修正:对取值为‑1的所有sprDistance进行修正,即将‑1修正为D<sub>smax</sub>+1,D<sub>smax</sub>为网络中的最大传播距离值,修正之后D<sub>smax</sub>+1为整个网络中的最大传播距离值;公式<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>I</mi><mi>n</mi><mi>f</mi><mi>l</mi><mi>u</mi><mi>e</mi><mi>n</mi><mi>c</mi><mi>e</mi><mo>=</mo><mi>&Sigma;</mi><mrow><mo>(</mo><mfrac><msub><mi>D</mi><mrow><mi>s</mi><mi>r</mi></mrow></msub><msub><mi>D</mi><mrow><mi>s</mi><mi>m</mi><mi>a</mi><mi>x</mi></mrow></msub></mfrac><mi>&Sigma;</mi><mi>&lambda;</mi><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000781155630000021.GIF" wi="579" he="135" /></maths>中的D<sub>smax</sub>为修正后的值。
地址 410083 湖南省长沙市岳麓区麓山南路932号