发明名称 |
确定网页属性的方法及装置 |
摘要 |
本申请提供一种确定网页属性的方法及装置,该方法包括:确定已知网页属性的URL的结构特征;确定目标URL的结构特征;比较已知网页属性的URL与目标URL的结构特征;以及当已知网页属性的URL与目标URL的结构特征相同或部分相同时,将已知网页属性的URL的至少部分网页属性确定为目标URL的网页属性。根据本申请,通过比较已知网页属性的URL与目标URL的结构特征,能够以很高的精度预先确定未下载过的网页(目标网页)的各种属性。 |
申请公布号 |
CN104376000A |
申请公布日期 |
2015.02.25 |
申请号 |
CN201310351347.6 |
申请日期 |
2013.08.13 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
蔡同利;洪文明;吴俊峰;徐健;黄玉燕;陈力;杨永辉;刘晖;何远银;曲广凡;李文祥 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京国昊天诚知识产权代理有限公司 11315 |
代理人 |
许志勇 |
主权项 |
一种确定网页属性的方法,其特征在于,包括:确定已知网页属性的URL的结构特征;确定目标URL的结构特征;比较已知网页属性的URL与目标URL的结构特征;以及当已知网页属性的URL与目标URL的结构特征相同或部分相同时,将已知网页属性的URL的至少部分网页属性确定为目标URL的网页属性。 |
地址 |
英属开曼群岛大开曼资本大厦一座四层847号邮箱 |