发明名称 面向科技文献的论文、作者和期刊排序模型及排序方法
摘要 本发明公布了一种面向科技文献的论文、作者和期刊排序模型及排序方法,属于数字图书馆领域。本发明根据科研文献网的特点,提出了PAJ模型,该模型是一个有向图,包括论文、作者、期刊或会议三种结点以及这三种结点间的五种关系。本发明同时提出了一种基于PAJ模型的排序方法,包括:抽取科研文献实体;建立PAJ模型;生成转移概率矩阵;对矩阵进行计算并生成结果。该算法利用矩阵迭代计算,达到收敛结果,以此作为排序的依据,能够充分挖掘科研文献网的内在联系,对各个实体的排名结果准确可信。
申请公布号 CN102298579A 申请公布日期 2011.12.28
申请号 CN201010204676.4 申请日期 2010.06.22
申请人 北京大学 发明人 方国栋;邓志鸿
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京万象新悦知识产权代理事务所(普通合伙) 11360 代理人 张肖琪
主权项 1.一种面向科研文献的排序模型,取名为PAJ模型,该模型为一个有向图,包含三种结点,分别是作者集合结点A、论文集合结点P、期刊或会议集合结点J,其特征在于,该模型还包括五种有向边,各边的权值定义如下:1)作者与文章之间的边<img file="FDA0000022537030000011.GIF" wi="643" he="187" />其中s<sub>p,a</sub>表示作者a在文章p中的排名;<img file="FDA0000022537030000012.GIF" wi="196" he="124" />表示该文章的所有作者的排名的倒数之和;2)作者与期刊或会议之间的边<img file="FDA0000022537030000013.GIF" wi="659" he="97" />其中p∈P(j)表示文章p在期刊或会议j上发表;a∈A(p)表示作者a是文章p的作者之一;3)文章与期刊或会议之间的边<img file="FDA0000022537030000014.GIF" wi="721" he="135" />即:如果论文p在期刊或会议j上发表,那么他们之间的边的权重为1,否则为0;4)文章与文章之间的边<img file="FDA0000022537030000015.GIF" wi="710" he="137" />即:如果文章p<sub>1</sub>引用了文章p<sub>2</sub>,那么e(p<sub>1</sub>,p<sub>2</sub>)的值为1,否则为0;5)作者与作者之间的边<img file="FDA0000022537030000016.GIF" wi="891" he="126" />
地址 100871 北京市海淀区颐和园路5号