发明名称 大量多元资料筛选管理的系统及其方法
摘要 一种大量多元资料筛选管理的系统及其方法,其可以减少资料比对人力成本,以及提升资料正确性,藉以得到普罗大众有兴趣的工商资料,并且提供给需要的客户。本发明整体流程包括:兴趣点(Point of Interest,POI)搜寻引擎模组、大量资料分类模组、大量资料比对模组、唯一标签(Unique Identification)定义模组、大量资料管理模组、企业应用系统整合资料比对模组、大量资料抽取模组及计费模组。
申请公布号 TWI453608 申请公布日期 2014.09.21
申请号 TW101103471 申请日期 2012.02.03
申请人 中华电信股份有限公司 桃园县杨梅市电研路99号 发明人 简晖紘;翁健钦;林继舜;王湘媚;周金良
分类号 G06F17/00 主分类号 G06F17/00
代理机构 代理人 李保禄 台北市中山区长安东路2段81号6楼
主权项 一种大量多元资料筛选管理系统,系结合资料库全文检索、资料档案格式转换、通讯、系统状态侦测技术,以达成全自动化的查询服务系统,其包括:a.兴趣点搜寻引擎模组,其系用以执行定时排程作业,利用一兴趣点搜寻引擎系统去抓取店家资料,归类至索引兴趣点网页资料库或索引兴趣点资料库,并把该索引兴趣点网页资料库做为待审核店家资料,而把该索引兴趣点资料库做为待分类店家资料;b.大量资料分类模组,其系用以接受该兴趣点搜寻引擎模组传递过来的指令,根据抓取到的店家资料内容或地理资讯,若有新资料传入的话,将主动分类属于店家基本资料或店家加值资料,对资料作整合性规划,并具有把审核过和已分类的该店家资料,回传至兴趣点主机资料库之能力,并通知该大量资料比对模组有新的资料进来,以启动该大量资料比对模组来处理资料;c.大量资料比对模组,其系用以接受该大量资料分类模组传递过来的指令,将执行网路上爬取到的该店家资料存进该索引兴趣点网页资料库和该索引兴趣点资料库进行比对作业,进而寻找到该索引兴趣点资料库未含有的店家资料或差异性的店家资料,并且将寻找到的该店家资料迳行发送给大量资料来源人工审核介面做审核动作;d.唯一标签定义模组,其系用以接受大量资料来源主机资料库所传递过来的资料,并且将整理过的资料写入至该兴趣点主机资料库,以指定的某特定标签栏位为唯一标签,格式为ASCII编码方式,将此新特定标签栏位移放到该兴趣点主机资料库进行管理,并通知大量资料管理模组;e.大量资料管理模组,其系用以接受唯一标签定义模组传递过来的指令,系到指定的资料库下读取资料并分类,以及规划定时排程将该店家资料或地理资讯传送至一兴趣点搜寻引擎资料库,且为系统可接受的标准格式;f.企业应用系统整合资料比对模组,主要系执行资料比对产生作业,会接受大量管理模组传递的指令产生相对应的资料,其资料来源是该兴趣点搜寻引擎资料库和该兴趣点主机资料库,并且会将产生的资料迳行发送给大量资料抽取人工审核介面做审核动作,并且通知该大量资料管理模组资料处理作业已经完成;g.大量资料抽取模组,系将标准化过的店家资料从该兴趣点主机资料库读取,并通知计费模组,及发简讯通知客户已经开始在处理此份申请案件;以及,h.计费模组,系执行费用计算以及告知客户,并且将计算完的结果迳行发送给客户以及相关处理人员;其中,该大量多元资料筛选管理的系统系用以同时处理多方资料来源、分析网页所传来的的店家资料或地理资讯,在短时间内查询大量的资料,利用该企业应用系统整合资料比对模组,与该大量管理模组中的原有店家资料比对,以得到精确的结果,并且结合该计费模组,告知客户送来的案件已经在处理中,以及本次查询将会收取之费用,待查询结果输出标准格式之后,自动按照客户所留下的E-MAIL位址,自动回寄给客户。
地址 桃园县杨梅市电研路99号