发明名称 |
一种确定网络资源的方法和装置 |
摘要 |
本发明实施例公开了一种确定网络资源的方法,包括:获取并保存第一统一资源定位器URL地址,第一URL地址对应的资源为二进制资源;确定保存的所述第一URL地址对应的站点;确定保存的站点对应的所述第一URL地址的数量;如果第一URL地址的数量不小于第一阈值,则查看所述第一URL地址对应的二进制资源的大小,如果二进制资源的大小小于第三阈值,则确定第一URL地址对应的二进制资源为第一网络资源。通过本发明实施例解决了二进制搜索引擎在获取Internet上的二进制资源的时候,由于不能对第一网络资源进行区分,从而降低了搜索引擎获取效率和搜索结果准确率的问题。本发明实施例同时公开了一种确定网络资源的装置。 |
申请公布号 |
CN101196910B |
申请公布日期 |
2010.08.18 |
申请号 |
CN200710195928.X |
申请日期 |
2007.12.04 |
申请人 |
深圳市迅雷网络技术有限公司 |
发明人 |
何超;刘智勇;张晶白 |
分类号 |
G06F17/30(2006.01)I;H04L12/54(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
刘松 |
主权项 |
一种确定网络资源的方法,其特征在于,该方法包括:获取第一URL地址,查看保存的站点对应的所述第一URL地址的重复数量,如果重复数量小于第二阈值,则保存获取的所述第一URL地址;否则,放弃保存,所述第一URL地址对应的资源为二进制资源;确定保存的所述第一URL地址对应的站点;确定保存的所述站点对应的所述第一URL地址的数量;如果所述第一URL地址的数量不小于第一阈值,则查看所述第一URL地址对应的二进制资源的大小,如果所述二进制资源的大小小于第三阈值,则确定所述第一URL地址对应的二进制资源为第一网络资源。 |
地址 |
518057 广东省深圳市南山区科技中二路深圳软件园11号楼7、8层 |