发明名称 |
网络爬虫 |
摘要 |
本发明公开了一种网络爬虫,包括一内核以及一Ajax抓取配置,该内核以及该Ajax抓取配置均集成有htmlunit,该Ajax抓取配置用于指定一网页的地址以及该网页中的待抓取的数据,该内核用于驱动搜索引擎,并基于该Ajax抓取配置提取该待抓取的数据。本发明能够支持Ajax的执行方式抓取网页页面的数据,并且支持异步请求的技术,可以使用JavaScript向服务器提出请求并处理响应,而且不会阻塞用户。 |
申请公布号 |
CN103853717A |
申请公布日期 |
2014.06.11 |
申请号 |
CN201210495699.4 |
申请日期 |
2012.11.28 |
申请人 |
纽海信息技术(上海)有限公司 |
发明人 |
刘涛 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海智信专利代理有限公司 31002 |
代理人 |
薛琦;王婧荷 |
主权项 |
一种网络爬虫,其特征在于,其包括一内核以及一Ajax抓取配置,该内核以及该Ajax抓取配置均集成有htmlunit,该Ajax抓取配置用于指定一网页的地址以及该网页中的待抓取的数据,该内核用于驱动搜索引擎,并基于该Ajax抓取配置提取该待抓取的数据。 |
地址 |
201203 上海市浦东新区祖冲之路295号102室 |