发明名称 利用网络爬虫技术快速准确寻找目的图书的方法
摘要 本发明公开了一种利用网络爬虫技术快速准确寻找目的图书的方法,流程如下:录入电子图书建立电子图书库,将录入的图书分类放入不同的子网页中,输入需要阅读图书的关键词,利用网络爬虫技术对与目的图书有关的图书网页进行抓取,对抓取得网页进行分析,分析后输出过滤后的图书,选择目的图书进行阅读。本发明电子图书库可以即时的录入新的电子图书,保证了该电子图书馆图书的图书种类的丰富性,采用网络爬虫技术获取目的图书更加迅准确图书的种类仅限于文字类,也有图片类,视频类等,该方法不仅适用于电子图书馆,也适用于电子图书网站,将会为电子图书的发展带来一定的促进。
申请公布号 CN103744945A 申请公布日期 2014.04.23
申请号 CN201310754637.5 申请日期 2013.12.31
申请人 上海伯释信息科技有限公司 发明人 朱龙腾
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海精晟知识产权代理有限公司 31253 代理人 冯子玲
主权项 一种利用网络爬虫技术快速准确寻找目的图书的方法,其特征在于它由以下步骤实现:步骤一:录入电子图书,建立电子图书库;步骤二:将录入的图书分类放入不同的子网页中;步骤三:输入需要阅读图书的关键词;步骤四:利用网络爬虫技术对与目的图书有关的图书网页进行抓取;步骤五:对抓取得网页进行分析;步骤六:分析后输出过滤后的图书,选择目的图书进行阅读。
地址 201100 上海市闵行区元江路5500号第1幢E3153室