发明名称 分组式数据查找抓取算法
摘要 本发明涉及一种分组式数据查找抓取算法,属于数据查找领域。所述方法包括制作数据查找模板,准备需要进行查找的数据源,从数据源的第一行开始提取与模板相同行数的数据,依次提取,循环从数据源中查找模板中需要查找的内容直至最后一行。利用本发明所述算法,可以将很多需要人为参与分析查找的数据实现自动化处理查找,只需要定义好相关的模板。最终可以减少相应的人力成本,同时提高数据查找工作效率。
申请公布号 CN104021225A 申请公布日期 2014.09.03
申请号 CN201410290983.7 申请日期 2014.06.25
申请人 郑州向心力通信技术股份有限公司 发明人 李伟;张雨
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京汇信合知识产权代理有限公司 11335 代理人 王咏雯
主权项 一种分组式数据查找抓取算法,其特征在于,包括以下步骤:步骤一:根据查找条件,制作数据查找模板;所述模板保留所述查找条件中定量数据的位置,所述查找条件的变量数据位置空出;步骤二:准备需要进行查找的数据源;步骤三:判断所述数据源中数据的行数是否大于等于所述模板中数据的行数,若否,则执行步骤十一;若是,执行步骤四;步骤四:从所述数据源的第一行开始提取与所述模板相同行数的数据;步骤五:在与所述模板中对应的各行数据中查找符合所述查找条件的数据;步骤六:判断从提取到的数据中是否可以查找到所有与所述模板对应的数据;若否,执行步骤七;若是,执行步骤九;步骤七:从所述数据源的上次提取数据的开始位置的下一行开始,重新提取与模板相同行数的数据;步骤八:循环从所述数据源中查找所述模板中需要查找的数据直至最后一行;步骤九:从上次提取数据的后行再取出一组和所述模板相同行数的数据;步骤十:循环从所述数据源中查找所述模板中需要查找的数据直至最后一行;步骤十一:查找结束。
地址 450000 河南省郑州市高新区翠竹街1号32号楼1单元01号501室