发明名称 一种网页中渲染数据收录的方法和装置
摘要 本发明实施例提供了一种网页中渲染数据收录的方法和装置,其中所述方法包括:判断当前抓取的网页页面是否存在有效的渲染数据;若判定所述网页页面存在有效的渲染数据,则收录所述有效的渲染数据。本发明实施例可以提高了有渲染能力的网络爬虫的收录能力,提高网页信息的完整性。
申请公布号 CN106126715A 申请公布日期 2016.11.16
申请号 CN201610509996.8 申请日期 2016.06.30
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 郑燕琴
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 赵娟
主权项 一种网页中渲染数据收录的方法,包括:判断当前抓取的网页页面是否存在有效的渲染数据;若判定所述网页页面存在有效的渲染数据,则收录所述有效的渲染数据。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)