发明名称 一种网络用户行为日志自动获取方法
摘要 本发明公开了一种网络用户行为日志自动获取方法,其特征在于:在客户端与Web服务器之间加上一代理服务器,代理服务器第一次接受Web服务器返回的响应正文为HTML格式的用户响应即HTTP响应,在该HTTP响应中加入用户行为日志采集模块,发送到客户端,用户行为日志采集模块在客户端充当用户行为日志的数据采集端,而代理服务器充当用户行为日志的数据处理端。本发明基于中间“代理服务器”策略,重点解决了客户端日志捕获、代理服务器策略部署、日志获取的可视化配置等关键技术。与传统的日志记录的方案相比,本发明可以很好的关联用户,而且扩展性很好,通过可视化UI方便灵活的定制目标系统需要采集的用户行为日志,也可为进一步的日志挖掘提供数据基础。
申请公布号 CN101651707A 申请公布日期 2010.02.17
申请号 CN200910023982.5 申请日期 2009.09.22
申请人 西安交通大学 发明人 吴茜媛;郑庆华;王庆磊;王昊;刘均;田锋
分类号 H04L29/08(2006.01)I;H04L29/06(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 西安通大专利代理有限责任公司 代理人 朱海临
主权项 1.一种网络用户行为日志自动获取方法,其特征在于:在客户端与Web服务器之间加上一代理服务器,代理服务器第一次接受Web服务器返回的响应正文为HTML格式的用户响应即HTTP响应,在该HTTP响应中加入用户行为日志采集模块,发送到客户端,用户行为日志采集模块在客户端充当用户行为日志的数据采集端,而代理服务器充当用户行为日志的数据处理端;引入代理服务器以后的信息交换模式具体包括下述步骤:1)用户通过客户端向Web服务器发送HTTP请求;2)代理服务器截获该HTTP请求并解析该HTTP请求的类型,以决定是否转发该HTTP请求:a.当请求为调用Web服务器资源,则:Step1:代理服务器转发该请求至Web服务器;Step2:转至步骤3);b.当请求为调用用户行为日志采集模块,则:Step1:代理服务器构建包含用户行为日志采集模块的HTTP响应;Step2:转至步骤5);c.当请求为发送采集的日志数据,则:Step1:代理服务器接收发送的日志数据;Step2:日志数据交由代理服务器上的日志处理模块处理;Step3:处理后的日志数据储存到代理服务器的日志文件中;Step4:代理服务器构建包含接收日志数据成功标志的HTTP响应;Step5:转至步骤5);3)代理服务器接收来自Web服务器返回的HTTP响应并判断该HTTP响应正文的类型:a.如果响应正文为HTML网页,转至步骤4);b.否则转至步骤5);4)代理服务器解析HTTP响应,并在该响应中修改HTTP响应头部的长度信息、在该响应正文中加入客户端日志采集模块;5)代理服务器将步骤2)包含用户行为日志采集模块的HTTP响应、包含接收日志数据成功标志的HTTP响应、步骤3)Web服务器返回的HTTP响应或者步骤4)修改后的HTTP响应发送至客户端。
地址 710049陕西省西安市咸宁路28号