发明名称 数据抓取方法和数据抓取系统
摘要 本发明提供了一种数据抓取方法和一种数据抓取系统,其中,数据抓取方法包括:配置多个正则表达式;按照多个正则表达式的预设顺序,从多个正则表达式中依次选取正则表达式;根据选取到的正则表达式在目标文件中匹配与目标数据相关联的数据,若匹配到相关联的数据,则抓取并返回相关联的数据,并终止从多个正则表达式中选取正则表达式,以及终止在目标文件中的匹配操作,以及,在根据每个正则表达式均未匹配到相关联的数据时,返回提示信息。通过本发明的技术方案,可以在其中一个系统需要获取其他系统中的数据时,只需配置相应的正则表达式就可以从其他系统中匹配并获取相应的数据,实现了不同系统之间能够方便地进行数据的共享。
申请公布号 CN104462158A 申请公布日期 2015.03.25
申请号 CN201310450449.3 申请日期 2013.09.25
申请人 北大方正集团有限公司;北京方正阿帕比技术有限公司 发明人 姚康明;邓克毅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京友联知识产权代理事务所(普通合伙) 11343 代理人 尚志峰;汪海屏
主权项 一种数据抓取方法,其特征在于,包括:配置对应于目标数据的多个正则表达式;按照所述多个正则表达式的预设顺序,从所述多个正则表达式中依次选取正则表达式;根据选取到的正则表达式在目标文件中匹配与所述目标数据相关联的数据,若匹配到所述相关联的数据,则抓取并返回所述相关联的数据,并终止从所述多个正则表达式中选取正则表达式,以及终止在所述目标文件中的匹配操作,以及,在根据所述多个正则表达式中的每个正则表达式均未匹配到所述相关联的数据时,返回提示信息。
地址 100871 北京市海淀区成府路298号方正大厦9层