发明名称 |
分组式数据查找抓取算法 |
摘要 |
本发明涉及一种分组式数据查找抓取算法,属于数据查找领域。所述方法包括制作数据查找模板,准备需要进行查找的数据源,从数据源的第一行开始提取与模板相同行数的数据,依次提取,循环从数据源中查找模板中需要查找的内容直至最后一行。利用本发明所述算法,可以将很多需要人为参与分析查找的数据实现自动化处理查找,只需要定义好相关的模板。最终可以减少相应的人力成本,同时提高数据查找工作效率。 |
申请公布号 |
CN104021225A |
申请公布日期 |
2014.09.03 |
申请号 |
CN201410290983.7 |
申请日期 |
2014.06.25 |
申请人 |
郑州向心力通信技术股份有限公司 |
发明人 |
李伟;张雨 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京汇信合知识产权代理有限公司 11335 |
代理人 |
王咏雯 |
主权项 |
一种分组式数据查找抓取算法,其特征在于,包括以下步骤:步骤一:根据查找条件,制作数据查找模板;所述模板保留所述查找条件中定量数据的位置,所述查找条件的变量数据位置空出;步骤二:准备需要进行查找的数据源;步骤三:判断所述数据源中数据的行数是否大于等于所述模板中数据的行数,若否,则执行步骤十一;若是,执行步骤四;步骤四:从所述数据源的第一行开始提取与所述模板相同行数的数据;步骤五:在与所述模板中对应的各行数据中查找符合所述查找条件的数据;步骤六:判断从提取到的数据中是否可以查找到所有与所述模板对应的数据;若否,执行步骤七;若是,执行步骤九;步骤七:从所述数据源的上次提取数据的开始位置的下一行开始,重新提取与模板相同行数的数据;步骤八:循环从所述数据源中查找所述模板中需要查找的数据直至最后一行;步骤九:从上次提取数据的后行再取出一组和所述模板相同行数的数据;步骤十:循环从所述数据源中查找所述模板中需要查找的数据直至最后一行;步骤十一:查找结束。 |
地址 |
450000 河南省郑州市高新区翠竹街1号32号楼1单元01号501室 |