发明名称 |
一种针对智慧能源终端数据的数据预处理方法 |
摘要 |
本发明公开了一种针对智慧能源终端数据的数据预处理方法,包括以下步骤;一,加载从智慧能源终端采集的数据集;二,对数据集进行清洗处理:识别数据集中缺失值,根据缺失值的属性查找数据集中对应属性相邻时间区段的数值,利用相邻数值的平均值来填充缺失值;三,对数据集进行转换处理:遍历数据集的属性,找出所有的数值属性,然后将该数值属性的原始值用区间标签进行替换;四,对数据集进行集成处理:对数据集的所有属性进行冗余检测,然后对数值重复进行检测,得到目标数据集,存储到数据仓库中。本发明提供方法能对采集到的数据集进行清洗、变换和集成处理,使得数据挖掘效率大大提高,挖掘结果更加准确有效。 |
申请公布号 |
CN106446094A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201610819818.5 |
申请日期 |
2016.09.13 |
申请人 |
国家电网公司;国网江苏省电力公司信息通信分公司;国网江苏省电力公司常州供电公司 |
发明人 |
邵康;许刚红;钱瑛;王春洁;王刚 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
南京纵横知识产权代理有限公司 32224 |
代理人 |
董建林 |
主权项 |
一种针对智慧能源终端数据的数据预处理方法,其特征是,包括以下步骤;步骤一,加载从智慧能源终端采集的数据集;步骤二,对数据集进行清洗处理:识别数据集中缺失值,根据缺失值的属性查找数据集中对应属性相邻时间区段的数值,利用相邻数值的平均值来填充缺失值;步骤三,对数据集进行转换处理:遍历数据集的属性,找出所有的数值属性,然后将该数值属性的原始值用区间标签进行替换,实现定量数据向定性数据转化,从而将连续型数据离散化;步骤四,对数据集进行集成处理:对数据集的所有属性进行冗余检测,然后对数值重复进行检测,得到目标数据集,存储到数据仓库中。 |
地址 |
江苏省南京市西长安街86号 |