发明名称 基于网页差异的网页分析方法及系统
摘要 本发明提出一种基于网页差异的网页分析方法及系统,其方法包括:采集需要分析的网页信息;根据采集的所述网页信息的节点结构,对所述网页信息进行聚类;根据所述聚类结果,提取出每一个节点中,节点内容变动的可视化网页元素;对提取出的可视化网页元素进行分类,以对所述可视化网页元素进行识别。本发明可以自动化地实现对网页内容的分析,无需人工操作,且通过提取可视化的变动网页元素,实现了针对用户关心的核心网页信息的分析,具有针对性强,分析效果好,节约了人力成本,效率高、解析能力强、通用性强的优点。
申请公布号 CN105512296A 申请公布日期 2016.04.20
申请号 CN201510917292.X 申请日期 2015.12.11
申请人 宁波中青华云新媒体科技有限公司 发明人 冯建兴;张云刚;翁时锋;梁丰;王遵义
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海唯源专利代理有限公司 31229 代理人 曾耀先
主权项 一种基于网页差异的网页分析方法,其特征在于,包括:采集需要分析的网页信息;根据采集的所述网页信息的节点结构,对所述网页信息进行聚类;根据所述聚类结果,提取出每一个节点中,节点内容变动的可视化网页元素;对提取出的可视化网页元素进行分类,以对所述可视化网页元素进行识别。
地址 315199 浙江省宁波市鄞州区泰康中路666号迪趣大厦8楼