发明名称 |
一种基于网络爬虫的自动化采集方法 |
摘要 |
本发明公开了一种基于网络爬虫的自动化采集方法,属于计算机网络爬虫技术领域,该自动化采集方法是利用聚焦网络爬虫抓取没采集服务器的采集功能地址,将服务器采集的功能地址加入到管理节点进行统一采集与配置管理;每台采集节点服务器中部署相应的采集程序,程序中的采集项会根据平台的差异,采集项也会对应改变,通过http访问资源的功能,获取到子节点的采集项,并对其操作。本发明的一种基于网络爬虫的自动化采集方法和现有技术相比,通过采用聚焦爬虫技术,不需要大量的人工进入到每台服务器进行配置与采集,不但大大减少了技术人员的工作量,有效的提高了工作效率,而且能方便采集管理,有效地提取并利用信息。 |
申请公布号 |
CN104866555A |
申请公布日期 |
2015.08.26 |
申请号 |
CN201510248866.9 |
申请日期 |
2015.05.15 |
申请人 |
浪潮软件集团有限公司 |
发明人 |
邱继钊;王传超;徐宏伟 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
济南信达专利事务所有限公司 37100 |
代理人 |
姜明 |
主权项 |
一种基于网络爬虫的自动化采集方法,其特征在于,该自动化采集方法是利用聚焦网络爬虫抓取没采集服务器的采集功能地址,将服务器采集的功能地址加入到管理节点进行统一采集与配置管理;每台采集节点服务器中部署相应的采集程序,程序中的采集项会根据平台的差异,采集项也会对应改变,通过http访问资源的功能,获取到子节点的采集项,并对其操作。 |
地址 |
250100 山东省济南市高新区孙村镇科航路2877号 |