发明名称 基于专业搜索引擎的爬虫策略获取图书信息的方法
摘要 本发明公开了一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。本发明提供的方法具有:使用方便、处理速度、技术实现容易等特点。
申请公布号 CN104598493A 申请公布日期 2015.05.06
申请号 CN201310535962.2 申请日期 2013.10.31
申请人 大连易维立方技术有限公司 发明人 张宇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书,在图书信息收索服务器登陆到上述网站后,自动匹配数字证书供网站校验;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,一旦搜索到图书更新信息后,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。
地址 116000 辽宁省大连市沙河口区兴工南五街1号1-25-5-2