发明名称 |
在线分析点击流数据的方法和相关装置及系统 |
摘要 |
本发明实施例公开了在线分析点击流数据的方法和相关装置及系统。其中一种在线分析点击流数据的方法,可包括:从广告业务服务器获取点击流数据;提取点击流数据中包含的关键信息;确定所述关键信息所对应的点击流类型;确定第一时间窗口;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤,则利用关键信息生成广告投放预测模型的训练数据。本发明实施例提供的技术方案有利于降低处理资源对得到训练数据的限制、提高广告投放预测模型的实时性、提高广告投放预测模型与线上实时数据的吻合度。 |
申请公布号 |
CN104091276B |
申请公布日期 |
2015.08.26 |
申请号 |
CN201310672117.X |
申请日期 |
2013.12.10 |
申请人 |
深圳市腾讯计算机系统有限公司 |
发明人 |
王洋;张书彬;薛伟;李勇;肖磊;刘大鹏;言艳花;姜磊;郭伟昭;胡少锋;柳金晶;黄丕培;徐妙;蔡斌 |
分类号 |
G06F17/30(2006.01)I;H04L29/06(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市深佳知识产权代理事务所(普通合伙) 44285 |
代理人 |
胡丽萍 |
主权项 |
一种在线分析点击流数据的方法,其特征在于,应用于分布式系统,所述方法包括:从广告业务服务器获取点击流数据;提取所述点击流数据中包含的关键信息;确定所述关键信息所对应的点击流类型;确定第一时间窗口;根据所述关键信息对应的点击流类型,以及所述关键信息对应的日志时间与所述第一时间窗口的对应关系,确定所述关键信息是否需要被过滤;若确定所述关键信息无需被过滤,则利用所述关键信息生成广告投放预测模型的训练数据;所述利用所述关键信息生成广告投放预测模型的训练数据,包括:调用流式计算拓扑,以所述关键信息为索引,在在线存储服务器中查找出与所述关键信息匹配的属性信息和特征信息;利用所述关键信息、所述属性信息和所述特征信息,生成广告投放预测模型的训练数据。 |
地址 |
518000 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼 |