发明名称 | 一种网络日志挖掘中的Web建模方法及系统 | ||
摘要 | 本发明公开了一种网络日志挖掘中的Web建模方法及系统,达到提高网站服务质量的目的。该方法包括:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,进行特征网页选取和网址分段,基于加权随机索引的方法建立用户浏览访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户访问模式矩阵进行优化聚类,并根据预设的类别标签标记用户所属的类别,建立用户公共档案;根据该用户公共档案以及预设的预取概率阈值,将预取概率超过预设的预取概率阈值的页面提取并保存到服务器的缓存中。本发明与现有预取技术相比,准确率有了大幅度的提高。 | ||
申请公布号 | CN102254004A | 申请公布日期 | 2011.11.23 |
申请号 | CN201110197622.4 | 申请日期 | 2011.07.14 |
申请人 | 北京邮电大学 | 发明人 | 李丽香;彭海朋;沈红斌;钮心忻 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 代理人 | ||
主权项 | 一种网络日志挖掘中的Web建模方法,其特征在于,包括如下步骤:对网络日志进行预处理,获得可信网络日志;根据用户的访问兴趣以及该可信网络日志,进行特征网页选取和网址分段,并基于加权随机索引的方法建立用户浏览访问模式矩阵;使用基于混沌蚁群优化的聚类算法对该用户浏览访问模式矩阵进行优化聚类,并根据预设的类别标签,标记用户所属的类别,建立用户公共档案;根据该用户公共档案以及预设的预取概率阈值,将预取概率超过预设的预取概率阈值的页面提取并保存到服务器的缓存中。 | ||
地址 | 100876 北京市海淀区西土城路10号 |