发明名称 |
电子书更新章节的调度方法和装置 |
摘要 |
本发明提供了一种电子书更新章节的调度方法和装置,该方法包括:针对电子书相关站点内新增的统一资源定位符URL,根据所述URL所属站点的URL模式Pattern词典,确定出所述URL的Pattern;根据所述URL的Pattern,从预设的电子书模式信息库中反向识别出所述URL所对应的电子书;并将识别出的电子书确定为已更新的电子书;在所述URL所属站点内对已更新的电子书的章节列表页发起调度,从中抓取已更新的电子书的所有更新章节。应用本发明,能够快速识别已更新的电子书,提高更新章节的抓取速度;而且无需频繁地进行抓取操作,提高了更新章节的抓取效率。 |
申请公布号 |
CN105630942A |
申请公布日期 |
2016.06.01 |
申请号 |
CN201510977669.0 |
申请日期 |
2015.12.23 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
邝景胜 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市立方律师事务所 11330 |
代理人 |
王增鑫 |
主权项 |
一种电子书更新章节的调度方法,其特征在于,包括:针对电子书相关站点内新增的统一资源定位符URL,根据所述URL所属站点的URL模式Pattern词典,确定出所述URL的Pattern;根据所述URL的Pattern,从预设的电子书模式信息库中反向识别出所述URL所对应的电子书;并将识别出的电子书确定为已更新的电子书;在所述URL所属站点内对已更新的电子书的章节列表页发起调度,从中抓取已更新的电子书的所有更新章节。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |