发明名称 |
基于终端访问统计的云网址推荐方法及系统及相关设备 |
摘要 |
本发明公开了一种基于终端访问统计的云网址推荐方法及系统及相关设备,其中方法主要包括:对终端访问过的网址进行存储,根据终端访问网址的频率对网址进行排序处理;根据网址排序的结果抓取对应的网址描述信息;存储网址及对应的网址描述信息到云端存储媒介;当接收到请求方的查询请求时,根据查询请求中的查询关键词在存储的网址及对应的网址描述信息中进行查询并返回查询结果,并将查询结果中频率排在前面的一个或多个网址作为推荐项目返回给请求方;本发明基于对访问行为的统计来计算网址的热度和排序,从而大幅提升推荐结果的质量和相关性。 |
申请公布号 |
CN102761627B |
申请公布日期 |
2015.12.09 |
申请号 |
CN201210216947.7 |
申请日期 |
2012.06.27 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
张绍瑞;宁浩宇 |
分类号 |
H04L29/12(2006.01)I;H04L29/06(2006.01)I;H04L29/08(2006.01)I |
主分类号 |
H04L29/12(2006.01)I |
代理机构 |
工业和信息化部电子专利中心 11010 |
代理人 |
马东伟 |
主权项 |
一种基于终端访问统计的云网址推荐系统,其特征在于,包括:排序处理单元、抓取处理单元、存储单元以及查询处理单元,其中,排序处理单元,适于对多个终端访问过的网址进行存储,根据多个终端访问网址的频率对网址进行排序处理;抓取处理单元,适于根据网址排序的结果抓取对应的网址描述信息;存储单元,适于存储抓取的网址及对应的网址描述信息到云端存储媒介;查询处理单元,适于当接收到请求方的查询请求时,根据查询请求中的关键词在存储的网址及对应的网址描述信息中进行查询并返回查询结果,并将查询结果中频率排在前面的一个或多个网址作为推荐项目返回给请求方;所述排序处理单元具体包括:统计模块,适于对终端访问网址的频率进行统计,按照终端访问频率从高到低的顺序对网址进行排序;文件生成模块,适于将排序后的网址生成指定格式的原始种子文件,所述原始种子文件包含多条数据记录,每条数据记录对应一个网址;分发模块,适于按照预定规则将所述原始种子文件分割成多个子文件,分别分发给每个抓取处理单元;所述抓取处理单元具体适于,对于每个子文件,根据其中记录的网址抓取对应的网址描述信息,将抓取得到的网址描述信息生成网址描述生成结果文件进行存储。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |