发明名称 |
一种计算网页重要性的方法 |
摘要 |
一种计算网页重要性的方法,基于网页内链接重要性与其在网页中的位置相关的算法,以及基于链接重要性与链接被用户点击次数多少有关的算法。该发明可应用于各种搜索引擎中,提高搜索效果。 |
申请公布号 |
CN102270246A |
申请公布日期 |
2011.12.07 |
申请号 |
CN201110265017.6 |
申请日期 |
2011.09.08 |
申请人 |
胡辉 |
发明人 |
胡辉 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于链接在网页中所处位置的计算网页重要性的方法,其特征在于,包含:(1)一个网页内指向其他网页的链接的重要性与其在该网页中的位置有关;(2)一个网页中各链接与屏幕中心的距离越近,该链接继承本网页重要性权重越大;(3)改进的PageRank计算模型HRank如下:假设页面T1…Tn都有链接指向页面A,d是一个阻尼因子,可以是0到1之间的一个数,HR(A)即是页面A的重要性值,而p(Ti)则是页面Ti中指向页面A的那个链接Link(Ti >A)的重要性系数,Si代表链接Link(Ti >A)起始位置与屏幕中心的距离,Ti页面中有m个指向其他页面的链接,则: <mrow> <mi>HR</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>)</mo> </mrow> <mo>=</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>d</mi> <munderover> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <mo>(</mo> <mi>HR</mi> <mrow> <mo>(</mo> <mi>Ti</mi> <mo>)</mo> </mrow> <mo>×</mo> <mi>p</mi> <mrow> <mo>(</mo> <mi>Ti</mi> <mo>)</mo> </mrow> <mo>)</mo> </mrow> </mrow>其中, <mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>Ti</mi> <mo>)</mo> </mrow> <mo>=</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>Si</mi> <mo>/</mo> <munderover> <mi>Σ</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mi>Sj</mi> <mo>+</mo> <mn>1</mn> <mo>/</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>/</mo> <mi>m</mi> </mrow>
|
地址 |
100012 北京市朝阳区北苑家园绣菊园10号楼2203 |