发明名称 |
自动下载和过滤网页的系统及方法 |
摘要 |
本发明提供一种自动下载和过滤网页的方法,该方法包括如下步骤:接收用户输入的搜索关键字和搜索平台的网址;将该关键字和网址转换成网站链接的脚本,并解析执行该脚本,获得资讯列表网页;将该资讯列表网页转换成处理资讯列表的脚本,并解析执行该脚本,获得资讯网页;将该资讯网页转换成处理资讯网页的脚本,并解析执行该脚本,获得无广告链接的资讯网页。利用本发明可以过滤掉网页中的无关链接,而且搜索的可配置性好。 |
申请公布号 |
CN101017490A |
申请公布日期 |
2007.08.15 |
申请号 |
CN200610033575.9 |
申请日期 |
2006.02.10 |
申请人 |
鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
发明人 |
李良普;李忠一;叶建发 |
分类号 |
G06F17/30(2006.01);H04L29/06(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
|
代理人 |
|
主权项 |
1.一种自动下载和过滤网页的系统,包括客户端及服务器,其中,客户端接收搜索关键字和搜索平台的网址信息,并将该关键字和网址信息发送给服务器,服务器根据客户端发送过来的信息从因特网上下载网页,并发送搜索结果信息给客户端,其特征在于,所述的服务器包括:脚本转换模块,用于将所述的关键字和网址信息转换成网站链接的脚本,将资讯列表网页转换成处理资讯列表的脚本,及将资讯网页转换成处理资讯网页的脚本;脚本解析模块,用于将网站链接的脚本解析成网站链接的指令文件,将处理资讯列表的脚本解析成下载资讯链接的指令文件,及将处理资讯网页的脚本解析成保存资料库的指令文件;指令执行模块,用于将上述指令文件中的指令放入指令队列,以及从指令队列中取出指令,并执行该指令。 |
地址 |
518109广东省深圳市宝安区龙华镇油松第十工业区东环二路2号 |