发明名称 |
一种基于搜索引擎获取IP地址归属地的方法和装置 |
摘要 |
本发明提供了一种基于搜索引擎获取IP地址归属地的方法和装置,其中方法包括:S1.获取一段时间内的用户搜索记录,所述用户搜索记录包括用户ID、查询词和用户IP地址,并识别所述用户搜索记录的查询词中的地名词以及带有地域属性的词;S2.利用预先标注IP地址归属地的用户搜索记录作为样本训练得到所述带有地域属性的词的置信度;S3.根据所述用户搜索记录中的用户ID、所识别出的查询词中的地名词以及带有地域属性的词和所述带有地域属性的词的置信度,确定该IP地址的归属地。本发明能够基于搜索引擎准确获取用户IP地址的归属地。 |
申请公布号 |
CN103207901A |
申请公布日期 |
2013.07.17 |
申请号 |
CN201310091285.X |
申请日期 |
2013.03.21 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
阮星华;才鑫 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
袁媛 |
主权项 |
一种基于搜索引擎获取互联网协议IP地址归属地的方法,其特征在于,该方法包括:S1、获取一段时间内的用户搜索记录,所述用户搜索记录包括用户标识ID、查询词和用户IP地址,并识别所述用户搜索记录的查询词中的地名词以及带有地域属性的词;S2、利用预先标注IP地址归属地的用户搜索记录作为样本训练得到所述带有地域属性的词的置信度;S3、根据所述用户搜索记录中的用户ID、所识别出的查询词中的地名词以及带有地域属性的词和所述带有地域属性的词的置信度,确定该IP地址的归属地。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |