发明名称 |
一种确定网站类型的方法和装置 |
摘要 |
本发明涉及网络通信技术,特别涉及一种确定网站类型的方法和装置,用以解决现有技术中存在的对于确定网站类型,需要将每个网站的内容都抓取下来并进行分析,从而需要大量的存储空间和计算量的问题。本发明实施例的方法包括:确定网站域名和网络资源标识的对应关系;将所述网站域名对应的所有所述网络资源标识与预先建立的网络资源标识集合进行匹配;在所述网站域名对应的所有网络资源标识中,匹配上的网络资源标识占所述网站域名对应的所有网络资源标识的比例大于第一阈值时,确定所述网站域名对应的网站类型为所述网络资源标识集合对应的网站类型。采用本发明实施例的方法能够降低存储空间和计算量。 |
申请公布号 |
CN101488140B |
申请公布日期 |
2011.01.19 |
申请号 |
CN200810185839.1 |
申请日期 |
2008.12.18 |
申请人 |
深圳市迅雷网络技术有限公司 |
发明人 |
张国强;陈晓东 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
刘松 |
主权项 |
一种确定网站类型的方法,其特征在于,该方法包括:确定网站域名和网络资源标识的对应关系;将所述网站域名对应的所有网络资源标识与预先建立的网络资源标识集合进行匹配,其中网络资源标识是用于标识下载文件的内容签名CID,所述CID是根据预设的算法对二进制文件的内容数据进行计算后获得的;在所述网站域名对应的所有网络资源标识中,匹配上的网络资源标识占所述网站域名对应的所有网络资源标识的比例大于第一阈值时,确定所述网站域名对应的网站类型为所述网络资源标识集合对应的网站类型。 |
地址 |
518057 广东省深圳市南山区科技中二路深圳软件园11号楼7、8层 |