发明名称 一种确定网络资源的方法和装置
摘要 本发明实施例公开了一种确定网络资源的方法,包括:获取并保存第一统一资源定位器URL地址,第一URL地址对应的资源为二进制资源;确定保存的所述第一URL地址对应的站点;确定保存的站点对应的所述第一URL地址的数量;如果第一URL地址的数量不小于第一阈值,则查看所述第一URL地址对应的二进制资源的大小,如果二进制资源的大小小于第三阈值,则确定第一URL地址对应的二进制资源为第一网络资源。通过本发明实施例解决了二进制搜索引擎在获取Internet上的二进制资源的时候,由于不能对第一网络资源进行区分,从而降低了搜索引擎获取效率和搜索结果准确率的问题。本发明实施例同时公开了一种确定网络资源的装置。
申请公布号 CN101196910B 申请公布日期 2010.08.18
申请号 CN200710195928.X 申请日期 2007.12.04
申请人 深圳市迅雷网络技术有限公司 发明人 何超;刘智勇;张晶白
分类号 G06F17/30(2006.01)I;H04L12/54(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 刘松
主权项 一种确定网络资源的方法,其特征在于,该方法包括:获取第一URL地址,查看保存的站点对应的所述第一URL地址的重复数量,如果重复数量小于第二阈值,则保存获取的所述第一URL地址;否则,放弃保存,所述第一URL地址对应的资源为二进制资源;确定保存的所述第一URL地址对应的站点;确定保存的所述站点对应的所述第一URL地址的数量;如果所述第一URL地址的数量不小于第一阈值,则查看所述第一URL地址对应的二进制资源的大小,如果所述二进制资源的大小小于第三阈值,则确定所述第一URL地址对应的二进制资源为第一网络资源。
地址 518057 广东省深圳市南山区科技中二路深圳软件园11号楼7、8层