发明名称 自动下载和过滤网页的系统及方法
摘要 本发明提供一种自动下载和过滤网页的方法,该方法包括如下步骤:接收用户输入的搜索关键字和搜索平台的网址;将该关键字和网址转换成网站链接的脚本,并解析执行该脚本,获得资讯列表网页;将该资讯列表网页转换成处理资讯列表的脚本,并解析执行该脚本,获得资讯网页;将该资讯网页转换成处理资讯网页的脚本,并解析执行该脚本,获得无广告链接的资讯网页。利用本发明可以过滤掉网页中的无关链接,而且搜索的可配置性好。
申请公布号 CN101017490A 申请公布日期 2007.08.15
申请号 CN200610033575.9 申请日期 2006.02.10
申请人 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 发明人 李良普;李忠一;叶建发
分类号 G06F17/30(2006.01);H04L29/06(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 代理人
主权项 1.一种自动下载和过滤网页的系统,包括客户端及服务器,其中,客户端接收搜索关键字和搜索平台的网址信息,并将该关键字和网址信息发送给服务器,服务器根据客户端发送过来的信息从因特网上下载网页,并发送搜索结果信息给客户端,其特征在于,所述的服务器包括:脚本转换模块,用于将所述的关键字和网址信息转换成网站链接的脚本,将资讯列表网页转换成处理资讯列表的脚本,及将资讯网页转换成处理资讯网页的脚本;脚本解析模块,用于将网站链接的脚本解析成网站链接的指令文件,将处理资讯列表的脚本解析成下载资讯链接的指令文件,及将处理资讯网页的脚本解析成保存资料库的指令文件;指令执行模块,用于将上述指令文件中的指令放入指令队列,以及从指令队列中取出指令,并执行该指令。
地址 518109广东省深圳市宝安区龙华镇油松第十工业区东环二路2号