发明名称 网络爬虫
摘要 本发明公开了一种网络爬虫,包括一内核以及一Ajax抓取配置,该内核以及该Ajax抓取配置均集成有htmlunit,该Ajax抓取配置用于指定一网页的地址以及该网页中的待抓取的数据,该内核用于驱动搜索引擎,并基于该Ajax抓取配置提取该待抓取的数据。本发明能够支持Ajax的执行方式抓取网页页面的数据,并且支持异步请求的技术,可以使用JavaScript向服务器提出请求并处理响应,而且不会阻塞用户。
申请公布号 CN103853717A 申请公布日期 2014.06.11
申请号 CN201210495699.4 申请日期 2012.11.28
申请人 纽海信息技术(上海)有限公司 发明人 刘涛
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海智信专利代理有限公司 31002 代理人 薛琦;王婧荷
主权项 一种网络爬虫,其特征在于,其包括一内核以及一Ajax抓取配置,该内核以及该Ajax抓取配置均集成有htmlunit,该Ajax抓取配置用于指定一网页的地址以及该网页中的待抓取的数据,该内核用于驱动搜索引擎,并基于该Ajax抓取配置提取该待抓取的数据。
地址 201203 上海市浦东新区祖冲之路295号102室