发明名称 确定网页属性的方法及装置
摘要 本申请提供一种确定网页属性的方法及装置,该方法包括:确定已知网页属性的URL的结构特征;确定目标URL的结构特征;比较已知网页属性的URL与目标URL的结构特征;以及当已知网页属性的URL与目标URL的结构特征相同或部分相同时,将已知网页属性的URL的至少部分网页属性确定为目标URL的网页属性。根据本申请,通过比较已知网页属性的URL与目标URL的结构特征,能够以很高的精度预先确定未下载过的网页(目标网页)的各种属性。
申请公布号 CN104376000A 申请公布日期 2015.02.25
申请号 CN201310351347.6 申请日期 2013.08.13
申请人 阿里巴巴集团控股有限公司 发明人 蔡同利;洪文明;吴俊峰;徐健;黄玉燕;陈力;杨永辉;刘晖;何远银;曲广凡;李文祥
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京国昊天诚知识产权代理有限公司 11315 代理人 许志勇
主权项 一种确定网页属性的方法,其特征在于,包括:确定已知网页属性的URL的结构特征;确定目标URL的结构特征;比较已知网页属性的URL与目标URL的结构特征;以及当已知网页属性的URL与目标URL的结构特征相同或部分相同时,将已知网页属性的URL的至少部分网页属性确定为目标URL的网页属性。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱