发明名称 |
一种生成集体宿舍IP库的方法和装置 |
摘要 |
一种生成集体宿舍IP库的方法及装置;方法包括:收集指定IP范围内用户的上网行为数据,提取已确认过是否为集体宿舍用户的cookie对应的上网行为数据作为第一数据集合,其余作为第二数据集合;计算第一比例;对于第二数据集合中的各cookie,分别选出差异最小的P个第一数据集合中的cookie,并计算其中属于集体宿舍用户的cookie所占的第二比例,如果大于或等于第一比例,则标记为备选用户;分别统计各IP地址所对应的、属于预定时间段的上网行为数据所包括的cookie中,备选用户所占的第三比例,如果大于预定比例阈值,则判断为集体宿舍IP地址;取判断为集体宿舍IP地址的IP地址组成集体宿舍IP库。 |
申请公布号 |
CN105025115A |
申请公布日期 |
2015.11.04 |
申请号 |
CN201410177742.1 |
申请日期 |
2014.04.29 |
申请人 |
北京秒针信息咨询有限公司 |
发明人 |
丁若谷;张诗晨;冯是聪;吴明辉 |
分类号 |
H04L29/12(2006.01)I |
主分类号 |
H04L29/12(2006.01)I |
代理机构 |
北京安信方达知识产权代理有限公司 11262 |
代理人 |
王丹;栗若木 |
主权项 |
一种生成集体宿舍IP库的方法,包括:S101、收集指定IP范围内用户的上网行为数据;所述上网行为数据包括cookie、IP地址、访问的网站,上网时间;S102、在所述上网行为数据中,提取已确认过是否为集体宿舍用户的cookie对应的上网行为数据作为第一数据集合,将其余上网行为数据作为第二数据集合;在所述已确认过是否为集体宿舍用户的cookie中,计算属于集体宿舍用户的cookie所占的比例,得到第一比例;S103、对于所述第二数据集合中的各cookie,分别选出与该cookie访问各网站的次数差异最小的P个第一数据集合中的cookie,并计算所选出的P个cookie中属于集体宿舍用户的cookie所占的第二比例,如果大于或等于所述第一比例,则将该第二数据集合中的cookie标记为备选用户;P为正整数;S104、对于所述上网行为数据中所出现的每个IP地址,分别统计该IP地址所对应的、上网时间属于预定时间段的上网行为数据所包括的cookie中,标记为备选用户的cookie所占的第三比例,如果大于预定比例阈值,则判断该IP地址为集体宿舍IP地址;S105、取所有判断为集体宿舍IP地址的IP地址组成集体宿舍IP库。 |
地址 |
100086 北京市海淀区青云里满庭芳园小区9号楼青云当代大厦20层2006室038号房间 |