发明名称 网页收集的方法及其系统
摘要 本发明实施例提供一种网页收集方法及其系统。所述网页收集方法包括:从URL数据库中逐条获取URL,并根据URL获得对应的host名进行网页内容的获取;根据所述host名,进行DNS请求;进行域名服务系统DNS请求的同时,根据DNS请求成功的URL,进行页面获取。通过本发明实施例提供的技术方案,DNS请求和页面获取分别同时进行,因此当获取页面代码时,也在不断的进行DNS请求,从而提高了网页收集的运转效率。
申请公布号 CN101303700B 申请公布日期 2010.04.21
申请号 CN200810111298.8 申请日期 2008.06.13
申请人 成都市华为赛门铁克科技有限公司 发明人 辛阳;雷宇;李娜;刘利锋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 逯长明
主权项 一种网页收集的方法,其特征在于,包括:从URL数据库中逐条获取URL,并根据URL获得对应的主机host名;根据所述host名,进行域名服务系统DNS请求,对DNS请求的结果进行管理,所述管理包括将请求成功的DNS请求结果保存在DNS数据库中;进行域名服务系统DNS请求的同时,根据所述DNS数据库中DNS请求成功的URL,进行页面获取。
地址 611731 四川省成都市高新区西部园区清水河片区