发明名称 网页抓取的方法及设备
摘要 本发明公开了网页抓取的方法及设备,其中所述方法包括:获取在目标网站上进行网页抓取的动态流量配额值;根据所述动态流量配额值,对所述目标网站上的网页进行抓取。通过本方法,在搜索引擎爬虫程序抓取网站中的网页时,减少了爬虫程序与被抓取站点的冲突,使爬虫程序抓取行为与搜索引擎更新需求得到了合理的平衡。
申请公布号 CN103530390A 申请公布日期 2014.01.22
申请号 CN201310499548.0 申请日期 2013.10.22
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 魏少俊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京华沛德权律师事务所 11302 代理人 刘杰
主权项 一种网页抓取的方法,包括:获取在目标网站上进行网页抓取的动态流量配额值;根据所述动态流量配额值,对所述目标网站上的网页进行抓取。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)