发明名称 一种基于分布式计算网络的日志文件分析方法和系统
摘要 本发明公开了一种基于分布式计算网络的日志文件分析方法和系统。所述方法包括:将用户标识与相应的日志信息存储在日志文件中;将所述日志文件划分为多个目标文件,所述目标文件中含有相同用户标识的日志信息;使用两个以上的节点分别对所述目标文件进行分析并得到分析结果;合并各节点的分析结果。这样,通过用户标识在不同的日志文件中建立关联,并可进一步分析用户访问网站不同内容之间的关系。
申请公布号 CN101192227B 申请公布日期 2011.05.25
申请号 CN200610160832.5 申请日期 2006.11.30
申请人 阿里巴巴集团控股有限公司 发明人 吴伟勋;李江华;张金银;李昂
分类号 G06F17/30(2006.01)I;G06Q10/00(2006.01)I;H04L12/24(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 逯长明
主权项 一种基于分布式计算网络的日志文件分析方法,所述分布式网络包括日志分析服务器和两个以上的节点,其特征在于,所述方法包括以下步骤:日志分析服务器从web服务器下载日志文件,所述日志文件含有用户标识及与该用户标识相应的日志信息;将所述日志文件划分为多个目标文件,每个目标文件中含有相同用户标识的日志信息;使用两个以上的节点分别对所述多个目标文件进行分析并得到分析结果;合并各节点的分析结果;其中,所述将日志文件划分为多个目标文件的过程包括:日志分析服务器将不同的日志文件发送至相应的各个节点;节点对收到的日志文件按用户标识分割为标识文件,将具有相同用户标识的日志信息放入同一个标识文件中,并将所述标识文件发送至日志分析服务器;日志分析服务器收集各个节点发送的标识文件,将具有相同用户标识的标识文件合并为一个文件作为目标文件。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱