发明名称 一种基于元数据的数据质量管理方法及系统
摘要 本发明提出一种基于元数据的数据质量管理方法,包括步骤:根据数据库内数据建立统一数据模型;根据建立的数据模型配置元数据;生成校验规则;配置执行策略,每一执行策略绑定一个或多个校验规则;按计划自动执行策略,在数据库中查找并存储目标数据;生成报告并分发。根据本发明的企业数据质量管理基于元数据进行,通过解析元数据设置的业务特征和管理特征结果,实现了数据完整性校验规则和数据合规性校验规则的自动生成,并以自动化手段全面支撑数据质量管理的事前防范事中检查以及事后评价。
申请公布号 CN103699693B 申请公布日期 2015.08.19
申请号 CN201410013537.1 申请日期 2014.01.10
申请人 中国南方电网有限责任公司;贵州电网公司信息通信分公司;广东卓维网络有限公司;贵州广思信息网络有限公司 发明人 张诗军;王志英;吕华辉;邹庆;罗四夕;罗念华;朱州;刘学仪;曹军;葛松;袁捷;关志伟;陈健欣
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州嘉权专利商标事务所有限公司 44205 代理人 谭英强
主权项 一种基于元数据的数据质量管理方法,其特征在于,包括以下步骤:1)根据数据库内数据建立统一数据模型,其中所述数据模型的内容包括业务系统中的对象、对象属性以及对象之间的关系,对象的元数据包括业务特征和管理特征;2)根据建立的数据模型配置元数据,其中根据数据库中的数据进行数据挖掘,自动生成数据的定义及数据之间的关系;3)按照制定的数据质量管理细则,基于存储的经验数据,通过解析元数据设置的业务特征和管理特征结果生成校验规则,以及导出含有所述校验规则的离线包,其中所述校验规则包括数据完整性校验规则和数据合规性校验规则,其中业务特征包括合同编号和合同签署日期,数据质量管理细则包括不允许合同签署日期的内容为空,校验规则包括检查该合同签署日期的内容是否为空;4)配置执行策略,每一执行策略绑定一个或多个校验规则,其中为所述执行策略配置自动执行的时间、周期以及开始和结束时间;5)按计划自动执行策略,在目标数据库中查找并存储目标数据,其中,在指定的时间,校验规则自动执行并抽取缺陷数据,其中将该合同签署日期为空的对应的合同编号的数据作为缺陷数据抽取出来以要求后续的整改;6)在策略执行完之后自动归档找到的目标数据,将本次查找到的目标数据与上次执行策略查找到的目标数据进行对比,分析并标记出本次查找到的目标数据中已经整改的数据,所述目标数据包括缺陷数据;7)缺陷数据处理完毕后,定期统计缺陷数据并生成数据质量报告,将数据质量报告分发给责任部门,以便责任部门根据数据质量报告进行数据整改,责任部门把已整改的数据同步到中间库,其中,统计缺陷数据包括统计数据质量情况和整改情况,数据质量报告包括问题数据条数、已整改记录条数、未整改记录条数以及缺陷数据明细。
地址 510627 广东省广州市天河区珠江新城华穗路6号