发明名称 一种跨域用户关联方法及信息推送方法
摘要 本发明公开了一种跨域用户关联方法及信息推送方法。本方法为:1)从网络中收集HTTP包,并按照设定的时间窗口对采集的包划分;2)对每一窗口内的包,根据FixCookie列表进行聚类,将同一用户的一次请求聚在一起,然后将各窗口内相同用户的用户组集合合并为一个用户组集合;3)对采集的包进行聚类,将主机名、cookie名和值相同的包聚为一组,将同一组内的包对应的用户组集合合并;4)对采集的包进行聚类,将主机名、cookie名和值相同且不存在fixCookie冲突的包聚为一组,将同一组内的包对应的用户组集合合并;5)将位于4)中同一用户组集合内的用户判定为不同域中的同一用户。本方法准确率高,聚类效果好。
申请公布号 CN104951499A 申请公布日期 2015.09.30
申请号 CN201510199720.X 申请日期 2015.04.23
申请人 中国科学院信息工程研究所 发明人 管洋洋;牛温佳;张博;毛志;李倩;谭建龙;郭莉
分类号 G06F17/30(2006.01)I;H04L29/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 司立彬
主权项 一种跨域用户关联方法,其步骤为:1)搜索域名的FixCookie,建立一FixCookie列表;2)从网络中收集HTTP包,并按照设定的时间窗口对采集的HTTP包进行划分;其中,该时间窗口为划分用户访问关联第三方的界限;3)对每一时间窗口内的HTTP包,根据FixCookie列表采用用户时序聚类分析器进行聚类,将同一用户的一次请求聚在一起,得到多个用户组集合;然后将各个时间窗口内相同用户的用户组集合合并为一个用户组集合;4)采用FixCookie聚类分析器对采集的HTTP包进行聚类,将主机名相同且cookie名、cookie值相同的HTTP包聚为一组,如果同一组内的HTTP包位于步骤3)合并后不同的用户组集合内,则再将对应的用户组集合合并为一个用户组集合;5)采用anyCookie聚类分析器对采集的HTTP包进行聚类,将主机名、cookie名、cookie值相同且不存在fixCookie冲突的HTTP包聚为一组,如果同一组内的HTTP包位于步骤4)合并后不同的用户组集合内,则再将对应的用户组集合合并为一个用户组集合;6)将位于步骤5)中同一用户组集合内的用户判定为不同域中的同一用户。
地址 100093 北京市海淀区闵庄路甲89号