发明名称 | 分布式爬虫集群系统 | ||
摘要 | 本发明公开了一种分布式爬虫集群系统,包括以下部件:网页爬抓器,超链接锁存储器,网页锁存储器以及超链接给予器。通过应用本发明所描述的系统,可以有效地解决分布式系统资源的占有矛盾问题;可以为开发分布式爬虫系统提供通用的设计架构;可以十分方便快捷地实现爬虫的集群系统;可以极大幅度地提高爬虫的爬抓速度。 | ||
申请公布号 | CN101499096A | 申请公布日期 | 2009.08.05 |
申请号 | CN200910080437.X | 申请日期 | 2009.03.18 |
申请人 | 北京邮电大学 | 发明人 | 杨溥;郭军;徐蔚然 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 代理人 | ||
主权项 | 1. 一种分布式爬虫集群系统,其特征在于包括:网页爬抓器,用于下载网页并且处理网页;超链接锁存储器,用于解决资源占有矛盾并且存储超链接;网页锁存储器,用于解决资源占有矛盾并且存储网页;超链接给予器,用于将超链接给予网页爬抓器。 | ||
地址 | 100876北京市海淀区西土城路10号 |