发明名称 |
用于网页页面点击分布的数据处理方法和装置 |
摘要 |
本发明公开了一种用于网页页面点击分布的数据处理方法和装置。该用于网页页面点击分布的数据处理方法包括:获取被监测网页页面的坐标系;通过坐标系确定目标区域,其中,目标区域包括整个被监测的网页页面和分割被监测的网页页面得到的被监测的网页页面子区域;通过坐标系记录确定的目标区域的点击量;以及根据记录的所述点击量计算所述目标区域内的点击均衡度。通过本发明,解决了相关技术中无法对点击分布状态进行定量分析的问题,进而达到了通过目标区域内的点击均衡度对点击分布状态进行定量分析的效果。 |
申请公布号 |
CN103544325B |
申请公布日期 |
2017.03.15 |
申请号 |
CN201310557775.4 |
申请日期 |
2013.11.11 |
申请人 |
北京国双科技有限公司 |
发明人 |
何鑫;刘合翔 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 11240 |
代理人 |
李志刚;吴贵明 |
主权项 |
一种用于网页页面点击分布的数据处理方法,其特征在于,包括:获取被监测的网页页面的坐标系;通过所述坐标系确定目标区域,其中,所述目标区域包括整个所述被监测的网页页面和分割所述被监测的网页页面得到的被监测的网页页面子区域;通过所述坐标系记录确定的所述目标区域的点击量;以及根据记录的所述点击量计算所述目标区域内的点击均衡度;通过所述坐标系记录确定的所述目标区域的点击量包括:获取所述目标区域的坐标集合;获取所述被监测网页页面的点击量集合,其中,所述点击量集合中的元素表示为【(X,Y),HITS】,其中,(X,Y)表示所述被监测网页页面上的像素点的坐标,HITS表示与所述像素点的坐标相对应的点击量,所述HITS为大于零的整数;判断所述坐标集合中的坐标与所述点击量集合元素中的坐标是否相同;如果判断出所述坐标集合中的坐标与所述点击量集合元素中的坐标相同,则将与所述坐标集合中的坐标相对应的点击量记录为所述HITS;如果判断出所述点击集合元素中的坐标与所述目标区域的坐标集合中的坐标不相同,则将与所述坐标集合中的坐标相对应的点击量记录为0;以及根据与所述坐标集合中的坐标相对应的点击量确定整个所述目标区域的点击量;在根据与所述坐标集合中的坐标相对应的点击量得到整个所述目标区域的点击量之后,所述数据处理方法还包括:根据得到的整个所述目标区域的点击量获取所述点击量的升序数列;根据记录的所述点击量计算所述目标区域内的点击均衡度包括:获取所述升序数列的项数,其中,项数值记为K;根据所述升序序列的项数获取项数为K的降序数列,其中,所述降序数列的首项为K,公差为1;获取项数为K的单位数列;以及根据所述升序数列、所述项数为K的降序数列、所述项数为K的单位数列和所述项数值计算所述目标区域内的点击均衡度,其中,计算所述目标区域内的点击均衡度的公式为:y=【2t(R)C】/【(K+1)t(R)I】,其中,R表示所述点击记录的升序数列的列向量,t(R)表示所述点击记录的升序数列的列向量R的转置向量,C表示所述项数为K的降序数列的列向量,I表示所述项数为K的单位数列的列向量。 |
地址 |
100086 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间 |