发明名称 为搜索引擎获取网络素材的方法、设备和系统
摘要 本发明涉及通信领域,公开了一种为搜索引擎获取网络素材的方法,包括,接收来自网络侧的报文,当接收到的报文为HTTP报文时,获取并存储报文中携带的网页信息。该方法能够在用户访问网络后就立即获取到素材,从而实现了搜索引擎网络素材数据库的及时更新。本发明还公开了一种为搜索引擎提供网络素材的网络设备和系统。
申请公布号 CN101477576B 申请公布日期 2013.08.28
申请号 CN200910105235.6 申请日期 2009.01.20
申请人 华为技术有限公司 发明人 张瑞
分类号 G06F17/30(2006.01)I;H04L29/06(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种为搜索引擎获取网络素材的方法,其特征在于,包括:接收来自网络侧的报文;当所述报文为超文本传输协议HTTP报文时,为搜索引擎获取所述HTTP报文中携带的网页信息;为所述搜索引擎存储所述HTTP报文中携带的网页信息;根据网页的IP地址、所述网页信息中词语出现的频率或用户的标识信息对被存储的所述HTTP报文中携带的网页信息进行分类;通过网络蜘蛛技术获取所述网页上链接的其他网页内容。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼