发明名称 |
页面的处理方法及装置 |
摘要 |
本申请提供一种页面的处理方法及装置。本申请实施例通过获取指定网站的页面,进而根据所述页面的页面特征,对所述页面进行聚类,以获得一个或多个类,使得能够根据所述一个或多个类之间的页面的链接关系,选择至少一个类,以作为列表页面集合,无需操作人员参与列表页面集合的建立过程,操作简单,且正确率高,从而提高了列表页面库建立的效率和可靠性。 |
申请公布号 |
CN104657391A |
申请公布日期 |
2015.05.27 |
申请号 |
CN201310598660.X |
申请日期 |
2013.11.21 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
陈沙;陈萌辉;陈一宁;何洪华;刘璋 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
倪志华 |
主权项 |
一种页面的处理方法,其特征在于,包括:获取指定网站的页面;根据所述页面的页面特征,对所述页面进行聚类,以获得一个或多个类;根据所述一个或多个类之间的页面的链接关系,选择至少一个类,以作为列表页面集合。 |
地址 |
英属开曼群岛大开曼资本大厦一座四层847号邮箱 |