发明名称 一种上下文web页面合并方法
摘要 本发明公开了一种上下文web页面合并方法。对于具有上下文关系的多个web页面中的某个web网页,首先对web页面的内容进行分析,提取其中的上下文链接信息并进行相应的下载,根据下载的内容扩展上下文,并将扩展的上下文内容进行消重,按顺序重新合并成新的单一web页面。本发明创造性地引入了web页面的语义分析技术,从而使web页面中的上下文关系更加清晰明确,页面合并的效率和质量大大提高。
申请公布号 CN102207974A 申请公布日期 2011.10.05
申请号 CN201110171125.7 申请日期 2011.06.23
申请人 天津海量信息技术有限公司 发明人 王东胜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汲智翼成知识产权代理事务所(普通合伙) 11381 代理人 陈曦
主权项 一种上下文web页面合并方法,其特征在于:对于具有上下文关系的多个web页面中的某个web网页,首先对所述web页面的内容进行分析,提取其中的上下文链接信息并进行相应的下载,根据下载的内容扩展上下文,并将扩展的上下文内容进行消重,按顺序重新合并成新的单一web页面。
地址 300384 天津市南开区华苑产业区榕苑路1号B北322-323室