发明名称 一种文本文件的并行解析过滤方法
摘要 本发明公开一种文本文件的并行解析过滤方法,涉及数据抽取转换技术,用于文本文件与hbase数据库的转换,通过配置数据模板及内置常用数据项,在解析出不同的文本文件类型后进行匹配解析,使得文本文件与数据模板中的常用数据项自动匹配;最后按照不同的数据分类存储到hbase数据库,进行文本文件的分类解析过滤。本发明通过配置数据模板及内置常用数据项实现文本文件的分类解析过滤,通过多线程入库hbase实现文本文件的分布式存储管理;增加了系统的可扩展性,同时使用了分类解析、存储、管理的方式,增强了文本数据解析过滤后的可用性。
申请公布号 CN105912735A 申请公布日期 2016.08.31
申请号 CN201610483787.0 申请日期 2016.06.28
申请人 浪潮软件股份有限公司 发明人 孙凯
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 济南信达专利事务所有限公司 37100 代理人 姜明
主权项 一种文本文件的并行解析过滤方法,其特征在于, 用于文本文件与hbase数据库的转换,通过配置数据模板及内置常用数据项,在解析出不同的文本文件类型后进行匹配解析,使得文本文件与数据模板中的常用数据项自动匹配;最后按照不同的数据分类存储到hbase数据库,进行文本文件的分类解析过滤。
地址 250101 山东省济南市高新区舜雅路1036号