发明名称 |
一种网页数据处理方法及装置 |
摘要 |
本申请实施例公开了一种网页数据处理方法及装置,其通过获取同一网页地址对应的预设网页和待测网页,并分别在上述预设网页和待测网页中存在实际内容的区域设置第一标识,以上述预设网页为基准,判断待测网页中设置有第一标识的区域是否与预设网页中设置有第一标识的区域匹配,根据判断结果判定该待测网页是否存在过滤问题。本申请能够自动检测多个网站、多个网页地址对应的网页的过滤问题;在某网页地址对应的网页排版样式和/或框架代码改变后,只需相应改变该网页地址对应的预设网页即可继续准确执行自动检测。因此,相对于人工检测法,本申请能够快速、及时地检测出网页存在的过滤问题,提高检测效率,尤其适用于待测网页数量巨大的场合。 |
申请公布号 |
CN104008131A |
申请公布日期 |
2014.08.27 |
申请号 |
CN201410182175.9 |
申请日期 |
2014.04.30 |
申请人 |
广州市动景计算机科技有限公司 |
发明人 |
王晓振 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京弘权知识产权代理事务所(普通合伙) 11363 |
代理人 |
逯长明;许伟群 |
主权项 |
一种网页数据处理方法,其特征在于,包括:获取待测网页,以及所述待测网页的网页地址对应的预设网页;分别在所述预设网页和待测网页中存在实际内容的区域设置第一标识;判断所述预设网页与所述待测网页中设置有所述第一标识的区域是否相匹配;如果所述预设网页与待测网页中设置有所述第一标识的区域相匹配,则判定所述待测网页不存在过滤问题,否则判定所述待测网页存在过滤问题。 |
地址 |
510627 广东省广州市天河区黄埔大道西平云路163号广电平云广场B塔16楼 |