发明名称 |
一种校验中间页信息的方法和装置 |
摘要 |
本发明提供了一种校验中间页信息的方法和装置,其中方法包括:抓取中间页;利用预先配置的中间页模板从抓取的中间页中解析待校验数据项的内容;抓取所述中间页所指向的详情页;利用预先配置的详情页模板从抓取的详情页中解析待校验数据项的内容;将同一待校验数据项在中间页中的内容与在详情页中的内容进行比对;输出比对结果。本发明不再依赖人工校验,实现了中间页信息校验的自动化,节约了人力成本,且具有高效、准确的特点。 |
申请公布号 |
CN104462257A |
申请公布日期 |
2015.03.25 |
申请号 |
CN201410674840.6 |
申请日期 |
2014.11.21 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
赵辉;闫庆宏;沙安澜 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
袁媛 |
主权项 |
一种校验中间页信息的方法,其特征在于,该方法包括:抓取中间页;利用预先配置的中间页模板从抓取的中间页中解析待校验数据项的内容;抓取所述中间页所指向的详情页;利用预先配置的详情页模板从抓取的详情页中解析待校验数据项的内容;将同一待校验数据项在中间页中的内容与在详情页中的内容进行比对;输出比对结果。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦 |