发明名称 |
一种根据服务器搜索日志数据进行用户分类的方法和装置 |
摘要 |
本发明公开了一种根据服务器的搜索日志数据进行用户分类的方法和装置。所述方法包括步骤:从服务器的搜索日志数据中获取用户搜索时使用的a个查询词、以及根据每个查询词搜索到的并且被用户访问过的b个访问页面;分别对每个查询词和对应于每个查询词的所述b个访问页面进行分词处理,以获得相应于每个查询词的c个关键词;根据所述c个关键词在所述每个查询词和所述b个访问页面中出现的次数,计算所述c个关键词的权重;从对应于所述a个查询词的关键词中选择权重最高的d个关键词,作为用户标签;将所述用户标签分别与预先设定的类别库中的e个类别相匹配,以将用户分类。 |
申请公布号 |
CN104217031A |
申请公布日期 |
2014.12.17 |
申请号 |
CN201410508424.9 |
申请日期 |
2014.09.28 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
孙鹏飞;王艳辉 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市中伦律师事务所 11410 |
代理人 |
贾媛媛;张思悦 |
主权项 |
一种根据服务器的搜索日志数据进行用户分类的方法,包括步骤:从服务器的搜索日志数据中获取用户搜索时使用的a个查询词、以及根据每个查询词搜索到的并且被用户访问过的b个访问页面;分别对每个查询词和对应于每个查询词的所述b个访问页面进行分词处理,以获得相应于每个查询词的c个关键词;根据所述c个关键词在所述每个查询词和所述b个访问页面中出现的次数,计算所述c个关键词的权重;从对应于所述a个查询词的关键词中选择权重最高的d个关键词,作为用户标签;将所述用户标签分别与预先设定的类别库中的e个类别相匹配,以将用户分类。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |