发明名称 |
一种上下文web页面合并方法 |
摘要 |
本发明公开了一种上下文web页面合并方法。对于具有上下文关系的多个web页面中的某个web网页,首先对web页面的内容进行分析,提取其中的上下文链接信息并进行相应的下载,根据下载的内容扩展上下文,并将扩展的上下文内容进行消重,按顺序重新合并成新的单一web页面。本发明创造性地引入了web页面的语义分析技术,从而使web页面中的上下文关系更加清晰明确,页面合并的效率和质量大大提高。 |
申请公布号 |
CN102207974A |
申请公布日期 |
2011.10.05 |
申请号 |
CN201110171125.7 |
申请日期 |
2011.06.23 |
申请人 |
天津海量信息技术有限公司 |
发明人 |
王东胜 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京汲智翼成知识产权代理事务所(普通合伙) 11381 |
代理人 |
陈曦 |
主权项 |
一种上下文web页面合并方法,其特征在于:对于具有上下文关系的多个web页面中的某个web网页,首先对所述web页面的内容进行分析,提取其中的上下文链接信息并进行相应的下载,根据下载的内容扩展上下文,并将扩展的上下文内容进行消重,按顺序重新合并成新的单一web页面。 |
地址 |
300384 天津市南开区华苑产业区榕苑路1号B北322-323室 |