发明名称 基于论文作者信息提取和关系权值模型的学术关系网构造方法
摘要 本发明提供了一种基于论文作者信息提取和关系权值模型的学术关系网构造方法。本发明针对特定领域,首先提取作者库中所有作者信息,构建初始的作者关系矩阵,其次建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵,然后基于作者关系矩阵确定两两作者间最优关系传递路径,构建作者关系圈;并定期更新作者关系矩阵和作者关系圈。其中两两作者间最优关系传递路径满足条件:两者之间经过的路径绝对值长度最短;在所有最短路径中关系值和最大;经过的最短路径小于6。本发明的作者关系权值模型体现了一篇文章中不同作者的真实关系值,构建的学术关系网更加合理,符合实际作者关系最优值,并实时反映最新的学术关系。
申请公布号 CN104156437A 申请公布日期 2014.11.19
申请号 CN201410395729.3 申请日期 2014.08.13
申请人 中科嘉速(北京)并行软件有限公司 发明人 袁伟;邓攀;闫碧莹;李玉成
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京永创新实专利事务所 11121 代理人 祗志洁
主权项 一种基于论文作者信息提取和关系权值模型的学术关系网构建方法,其特征在于,通过如下步骤实现:步骤1、提取作者信息,构建初始的作者关系矩阵;所述的作者关系矩阵的第i行第j列的元素值为作者i和作者j的关系值,用0表示作者与自己的关系,‑1表示两位作者之间的关系不可达;初始的作者关系矩阵中,对角线上元素值为0,其余位置元素值为‑1;步骤2:建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵;所述的作者关系权值模型为:设一篇论文P,包括通讯作者在内共有N个作者,设作者A和B分别为论文P的第m作者和第n作者,则论文P为作者A与B的关系值贡献的参考值Relation&lt;P,&lt;A,B&gt;&gt;=<img file="FDA0000552997350000011.GIF" wi="1904" he="311" />其中,c为第一作者和通讯作者的关系加强值;x表示作者机构决定的作者关系的权重;当A和B属于同一机构或单位时,参数T的值为1,否则T的值为0;S为由作者次序反映作者关系远近信息的分界值;d表示第一作者和作者次序在S+1位之前的非通讯作者的关系加强值;e表示第一作者和作者次序在S位之后的非通讯作者的关系在关系加强值d基础上的削弱值;所得到的参考值四舍五入到整数;设k篇论文为作者A和B的关系值贡献的参考值分别为r<sub>1</sub>,r<sub>2</sub>,…,r<sub>k</sub>,则作者A和B的关系值为:<img file="FDA0000552997350000012.GIF" wi="486" he="80" />用得到的关系值更新作者关系矩阵中表示A和B关系值的元素值;步骤3:基于步骤2更新的作者关系矩阵确定两两作者间最优关系传递路径,最优关系传递路径需满足以下几个条件:1)两者之间经过的路径绝对值长度最短;2)在所有最短路径中关系值和最大;3)经过的最短路径小于6;根据最优关系传递路径构建作者关系圈;步骤4、定期更新作者关系矩阵和作者关系圈。
地址 100190 北京市海淀区中关村南四街4号