发明名称 一种用于电网运行设备的信息挖掘与数据质量的校验方法
摘要 本发明公开了一种用于电网运行设备的信息挖掘与数据质量的校验方法,(1)编写文学源文件;(2)执行文学源文件;(3)生成指定格式的报告或演示文档;(4)数据校验;(5)可视化校验。通过上述方式,本发明用于电网运行设备的信息挖掘与数据质量的校验方法通过采用文学化编程、机器学技术、数据可视化,提高分析效率、节约人力成本、保证分析校验报告的客观性和可追溯性、便于可重复研究、提高异常数据的检验效率、分析方式直观易懂,在用于电网运行设备的信息挖掘与数据质量的校验方法的普及上有着广泛的市场前景。
申请公布号 CN105718432A 申请公布日期 2016.06.29
申请号 CN201610147354.8 申请日期 2016.03.16
申请人 北京睿新科技有限公司 发明人 李明
分类号 G06F17/22(2006.01)I;G06F17/24(2006.01)I;G06F17/25(2006.01)I;G06N99/00(2010.01)I;G06F9/44(2006.01)I;G06T11/20(2006.01)I;G06Q50/06(2012.01)I 主分类号 G06F17/22(2006.01)I
代理机构 苏州广正知识产权代理有限公司 32234 代理人 徐萍
主权项 一种用于电网运行设备的信息挖掘与数据质量的校验方法,其特征在于,包括以下步骤:(1)编写文学源文件:所述文学源文件包括rnw格式和Rmd格式,所述文学源文件均包括文档模板和程序;(2)执行文学源文件:运行工具执行文学源文件自动完成内置的程序,执行数据读取、预处理以及数据分析步骤,并把来自所述文档模块的报告文字和格式描述通过所述程序返回的计算结果转换为一种标记语言,同时把程序生成的可视化图表保存为指定格式的图片文件;(3)生成指定格式的报告或演示文档:运行相应的标记语言转换工具,自动插入图片并生成指定格式的报告或演示文档;(4)数据校验:采用机器学习模型进行电网设备数据质量校验,所述机器学习模型包括局部回归模型和局部异常因子模型,所述局部回归模型采用等范围估计模型来预测设备的合理参数范围,再和实际数据进行对比,所述局部异常因子模型采用等离群指数模型,计算每个数据样本的“离群指数”,离群指数越高的样本有数据质量问题的可能性越大;(5)可视化校验:采用数据可视化方法进行电网设备数据质量校验。
地址 100015 北京市朝阳区将台路5号院5号楼2112室