发明名称 | 一种结合差异特征分布与链接特征的网页排序方法 | ||
摘要 | 本发明涉及一种结合差异特征分布与链接特征的网页排序方法。首先通过TrustRank算法计算网页信任值;分析已标记为正常与垃圾网页的差异特征分布,选择正常网页与垃圾网页差异特征分布有明显差异的特征,称为差异特征;根据网页差异特征分布,计算网页差异特征的信任贡献值;结合网页信任值与网页差异特征的信任贡献值计算网页信任度;根据网页信任度对网页排序。本发明利用正常网页与垃圾网页在分布上存在差异的内容特征,结合网页链接特征,更好地提高好网页的排序,降低垃圾网页的排序。 | ||
申请公布号 | CN102750380A | 申请公布日期 | 2012.10.24 |
申请号 | CN201210215860.8 | 申请日期 | 2012.06.27 |
申请人 | 山东师范大学 | 发明人 | 张化祥;张悦童;刘阳 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 济南圣达知识产权代理有限公司 37221 | 代理人 | 张勇 |
主权项 | 一种结合差异特征分布与链接特征的网页排序方法,其特征是,首先通过TrustRank算法计算网页信任值;分析已标记为正常与垃圾网页的特征分布,选择正常网页与垃圾网页特征分布有明显差异的特征,称为差异特征;然后根据差异特征分布,计算网页差异特征信任贡献值;结合网页信任值与网页内容特征值计算网页信任度;根据网页信任度对网页排序。 | ||
地址 | 250014 山东省济南市历下区文化东路88号 |