发明名称 |
基于网页差异的网页分析方法及系统 |
摘要 |
本发明提出一种基于网页差异的网页分析方法及系统,其方法包括:采集需要分析的网页信息;根据采集的所述网页信息的节点结构,对所述网页信息进行聚类;根据所述聚类结果,提取出每一个节点中,节点内容变动的可视化网页元素;对提取出的可视化网页元素进行分类,以对所述可视化网页元素进行识别。本发明可以自动化地实现对网页内容的分析,无需人工操作,且通过提取可视化的变动网页元素,实现了针对用户关心的核心网页信息的分析,具有针对性强,分析效果好,节约了人力成本,效率高、解析能力强、通用性强的优点。 |
申请公布号 |
CN105512296A |
申请公布日期 |
2016.04.20 |
申请号 |
CN201510917292.X |
申请日期 |
2015.12.11 |
申请人 |
宁波中青华云新媒体科技有限公司 |
发明人 |
冯建兴;张云刚;翁时锋;梁丰;王遵义 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海唯源专利代理有限公司 31229 |
代理人 |
曾耀先 |
主权项 |
一种基于网页差异的网页分析方法,其特征在于,包括:采集需要分析的网页信息;根据采集的所述网页信息的节点结构,对所述网页信息进行聚类;根据所述聚类结果,提取出每一个节点中,节点内容变动的可视化网页元素;对提取出的可视化网页元素进行分类,以对所述可视化网页元素进行识别。 |
地址 |
315199 浙江省宁波市鄞州区泰康中路666号迪趣大厦8楼 |