发明名称 |
一种网页更新探测方法、网页信息抓取及呈现方法 |
摘要 |
本发明公开了一种网页更新探测方法、网页信息抓取及呈现方法,所述网页更新探测方法包括:s1、分析预定url网页的框架结构并确定抓取信息区域;s2、对所述抓取信息区域的信息跟本地信息进行相似度比对;s3、当相似度低于设定的阈值时判定该rul网页有更新,否则判定该url网页无更新。该网页更新探测方法可以准确判断网页的更新信息,从而避免被无关更新误导,进而避免浪费时间及贷款资源。 |
申请公布号 |
CN106227823A |
申请公布日期 |
2016.12.14 |
申请号 |
CN201610587575.7 |
申请日期 |
2016.07.21 |
申请人 |
知几科技(深圳)有限公司 |
发明人 |
王喜宗 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳新创友知识产权代理有限公司 44223 |
代理人 |
王震宇 |
主权项 |
一种网页更新探测方法,其特征在于:s1、分析预定url网页的框架结构并确定抓取信息区域;s2、对所述抓取信息区域的信息跟本地信息进行相似度比对;s3、当相似度低于设定的阈值时判定该rul网页有更新,否则判定该url网页无更新。 |
地址 |
518048 广东省深圳市福田保税区绒花路8号城市三米六公寓1319室 |