主权项 |
一种基于论文作者信息提取和关系权值模型的学术关系网构建方法,其特征在于,通过如下步骤实现:步骤1、提取作者信息,构建初始的作者关系矩阵;所述的作者关系矩阵的第i行第j列的元素值为作者i和作者j的关系值,用0表示作者与自己的关系,‑1表示两位作者之间的关系不可达;初始的作者关系矩阵中,对角线上元素值为0,其余位置元素值为‑1;步骤2:建立作者关系权值模型,根据每篇论文的作者信息更新作者关系矩阵;所述的作者关系权值模型为:设一篇论文P,包括通讯作者在内共有N个作者,设作者A和B分别为论文P的第m作者和第n作者,则论文P为作者A与B的关系值贡献的参考值Relation<P,<A,B>>=<img file="FDA0000552997350000011.GIF" wi="1904" he="311" />其中,c为第一作者和通讯作者的关系加强值;x表示作者机构决定的作者关系的权重;当A和B属于同一机构或单位时,参数T的值为1,否则T的值为0;S为由作者次序反映作者关系远近信息的分界值;d表示第一作者和作者次序在S+1位之前的非通讯作者的关系加强值;e表示第一作者和作者次序在S位之后的非通讯作者的关系在关系加强值d基础上的削弱值;所得到的参考值四舍五入到整数;设k篇论文为作者A和B的关系值贡献的参考值分别为r<sub>1</sub>,r<sub>2</sub>,…,r<sub>k</sub>,则作者A和B的关系值为:<img file="FDA0000552997350000012.GIF" wi="486" he="80" />用得到的关系值更新作者关系矩阵中表示A和B关系值的元素值;步骤3:基于步骤2更新的作者关系矩阵确定两两作者间最优关系传递路径,最优关系传递路径需满足以下几个条件:1)两者之间经过的路径绝对值长度最短;2)在所有最短路径中关系值和最大;3)经过的最短路径小于6;根据最优关系传递路径构建作者关系圈;步骤4、定期更新作者关系矩阵和作者关系圈。 |