发明名称 | 对数据文件的数据清洗方法和数据文件处理方法 | ||
摘要 | 本发明公开了一种对数据文件的数据清洗方法和数据文件处理方法,该数据清洗方法包括:步骤S2:根据源系统数据表的数据定义、预定义的数据下传平台对数据的统一要求以及分析类系统对数据的统一要求,确定每个数据文件的清洗内容和清洗规则,并编制清洗进程步骤;步骤S4:按照每个数据文件的清洗内容和清洗规则生成对应于每个数据文件的清洗配置文件;步骤S6:依据清洗配置文件,以清洗进程步骤对数据文件进行清洗。本发明的有益效果在于,针对各源系统中不同的数据文件抽取出来进行统一梳理(数据清洗),用统一的方式呈现数据文件并共享使用,从而为后续各层次数据加工处理提供了统一视图,能够减轻源系统的处理负担。 | ||
申请公布号 | CN104361064A | 申请公布日期 | 2015.02.18 |
申请号 | CN201410613607.7 | 申请日期 | 2014.11.04 |
申请人 | 中国银行股份有限公司 | 发明人 | 王莉;陈世强 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京金信知识产权代理有限公司 11225 | 代理人 | 黄威;喻嵘 |
主权项 | 一种对数据文件的数据清洗方法,其特征在于,包括:步骤S2:根据源系统数据表的数据定义、预定义的数据下传平台对数据的统一要求以及分析类系统对数据的统一要求,确定每个所述数据文件的清洗内容和清洗规则,并编制清洗进程步骤;步骤S4:按照每个所述数据文件的清洗内容和清洗规则生成对应于每个数据文件的清洗配置文件;步骤S6:依据所述清洗配置文件,以所述清洗进程步骤对所述数据文件进行清洗。 | ||
地址 | 100818 北京市西城区复兴门内大街1号 |