发明名称 | 一种网站数据分析方法及分析系统 | ||
摘要 | 本申请提供了一种网站数据分析方法及分析系统,能够从数据流的角度对全网数据进行分析。所述方法包括:通过分析网站日志数据,获得访问数据流,所述访问数据流记录了访问网页的顺序;剔除不包含重要页面的访问数据流,其中,所述重要页面为符合预定义属性的页面;对剩余的包含重要页面的访问数据流进行频繁挖掘计算,得到出现频度高的前m个访问数据流及每个访问数据流的出现频度;针对所述m个访问数据流,计算每个数据流中出现重要页面的次数,以及每个数据流的长度;利用每个访问数据流的出现频度、出现重要页面的次数和数据流的长度,计算得出所述m个访问数据流中每个数据流的优质度。本申请通过网站数据流的分析来指导网站UI的设计。 | ||
申请公布号 | CN103425661B | 申请公布日期 | 2016.10.05 |
申请号 | CN201210151293.4 | 申请日期 | 2012.05.15 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 殷霞 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京润泽恒知识产权代理有限公司 11319 | 代理人 | 苏培华 |
主权项 | 一种网站数据分析方法,其特征在于,包括:通过分析网站日志数据,获得访问数据流,其中,所述访问数据流记录了访问网页的顺序;剔除不包含重要页面的访问数据流,其中,所述重要页面为符合预定义属性的页面;对剩余的包含重要页面的访问数据流进行频繁挖掘计算,得到出现频度高的前m个访问数据流及每个访问数据流的出现频度,m为正整数;针对所述m个访问数据流,计算每个数据流中出现重要页面的次数,以及每个数据流的长度;利用每个访问数据流的出现频度、出现重要页面的次数和数据流的长度,计算得出所述m个访问数据流中每个数据流的优质度。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |