发明名称 页面的处理方法及装置
摘要 本申请提供一种页面的处理方法及装置。本申请实施例通过获取指定网站的页面,进而根据所述页面的页面特征,对所述页面进行聚类,以获得一个或多个类,使得能够根据所述一个或多个类之间的页面的链接关系,选择至少一个类,以作为列表页面集合,无需操作人员参与列表页面集合的建立过程,操作简单,且正确率高,从而提高了列表页面库建立的效率和可靠性。
申请公布号 CN104657391A 申请公布日期 2015.05.27
申请号 CN201310598660.X 申请日期 2013.11.21
申请人 阿里巴巴集团控股有限公司 发明人 陈沙;陈萌辉;陈一宁;何洪华;刘璋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人 倪志华
主权项 一种页面的处理方法,其特征在于,包括:获取指定网站的页面;根据所述页面的页面特征,对所述页面进行聚类,以获得一个或多个类;根据所述一个或多个类之间的页面的链接关系,选择至少一个类,以作为列表页面集合。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱