发明名称 | 一种网页预取方法和系统 | ||
摘要 | 本发明公开了一种基于混沌蚁群优化聚类的网页预取方法和系统,达到提高网站服务质量的目的。该方法包括:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,建立表达用户是否访问了特征网页的用户访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别数目标签标记用户所属的类别,建立用户公共档案;根据该用户公共档案,将预取概率超过预设的预取概率阈值的页面提取并保存到缓存中。本发明与现有预取技术相比,准确率有了大幅度的提高。 | ||
申请公布号 | CN102222098A | 申请公布日期 | 2011.10.19 |
申请号 | CN201110165459.3 | 申请日期 | 2011.06.20 |
申请人 | 北京邮电大学 | 发明人 | 彭海朋;万淼;沈红斌;李丽香;王枞;杨义先 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 代理人 | ||
主权项 | 一种基于混沌蚁群优化聚类的网页预取方法,其特征在于,包括如下步骤:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,建立表达用户是否访问了特征网页的用户访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别数目标签,标记用户所属的类别,建立用户公共档案;根据该用户公共档案,将预取概率超过预设的预取概率阈值的页面提取并保存到缓存中。 | ||
地址 | 100876 北京市海淀区西土城路10号 |