发明名称 一种针对智慧能源终端数据的数据预处理方法
摘要 本发明公开了一种针对智慧能源终端数据的数据预处理方法,包括以下步骤;一,加载从智慧能源终端采集的数据集;二,对数据集进行清洗处理:识别数据集中缺失值,根据缺失值的属性查找数据集中对应属性相邻时间区段的数值,利用相邻数值的平均值来填充缺失值;三,对数据集进行转换处理:遍历数据集的属性,找出所有的数值属性,然后将该数值属性的原始值用区间标签进行替换;四,对数据集进行集成处理:对数据集的所有属性进行冗余检测,然后对数值重复进行检测,得到目标数据集,存储到数据仓库中。本发明提供方法能对采集到的数据集进行清洗、变换和集成处理,使得数据挖掘效率大大提高,挖掘结果更加准确有效。
申请公布号 CN106446094A 申请公布日期 2017.02.22
申请号 CN201610819818.5 申请日期 2016.09.13
申请人 国家电网公司;国网江苏省电力公司信息通信分公司;国网江苏省电力公司常州供电公司 发明人 邵康;许刚红;钱瑛;王春洁;王刚
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京纵横知识产权代理有限公司 32224 代理人 董建林
主权项 一种针对智慧能源终端数据的数据预处理方法,其特征是,包括以下步骤;步骤一,加载从智慧能源终端采集的数据集;步骤二,对数据集进行清洗处理:识别数据集中缺失值,根据缺失值的属性查找数据集中对应属性相邻时间区段的数值,利用相邻数值的平均值来填充缺失值;步骤三,对数据集进行转换处理:遍历数据集的属性,找出所有的数值属性,然后将该数值属性的原始值用区间标签进行替换,实现定量数据向定性数据转化,从而将连续型数据离散化;步骤四,对数据集进行集成处理:对数据集的所有属性进行冗余检测,然后对数值重复进行检测,得到目标数据集,存储到数据仓库中。
地址 江苏省南京市西长安街86号