发明名称 |
结构化网站日志的压缩方法 |
摘要 |
本发明提供一种结构化网站日志的压缩方法,其特征在于,包括以下步骤:网站日志分解步骤,将网站日志中每条记录根据结构分解为多个字段;建立编码器步骤,对分解后的网站日志的每个字段生成对应的编码器,并建立对应的编码器对照表;编码步骤,使用编码器对网站日志进行重新编码,得到FACT文件,对FACT文件进行分析以得到报表文件;解码步骤,通过建立编码器步骤得到的编码器对照表对编码步骤得到的报表文件进行解码,得到最终报表文件。本发明的结构化网站日志的压缩方法可以快速有效的对网站日志进行压缩,同时不破坏原网站日志的结构性,减小分析软件所需分析的网站日志的规模。 |
申请公布号 |
CN104408100A |
申请公布日期 |
2015.03.11 |
申请号 |
CN201410663256.0 |
申请日期 |
2014.11.19 |
申请人 |
北京融海恒信咨询有限公司 |
发明人 |
胡大祥 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京青松知识产权代理事务所(特殊普通合伙) 11384 |
代理人 |
郑青松 |
主权项 |
一种结构化网站日志的压缩方法,其特征在于,包括以下步骤:网站日志分解步骤,将网站日志中每条记录根据结构分解为多个字段;建立编码器步骤,对分解后的所述网站日志的每个字段生成对应的编码器,并建立对应的编码器对照表;编码步骤,使用所述编码器对网站日志进行重新编码,得到FACT文件,对FACT文件进行分析以得到报表文件;解码步骤,通过所述建立编码器步骤得到的编码器对照表对所述编码步骤得到的报表文件进行解码,得到最终报表文件。 |
地址 |
100044 北京市海淀区中关村南大街6号中电信息大厦1502-1503室 |