发明名称 一种用于光伏电站数据采集系统的数据处理方法
摘要 本发明提供了一种用于光伏电站数据采集系统的数据处理方法,其特征在于,首先对数据做一个细分,将数据分为正常数据和异常数据,通过对异常数据的分析和校验,将异常数据分为人为原因导致和系统原因导致;人为原因导致的,用判断域值的方法修正,不能修正的直接删除;系统原因导致的数据异常,用变量联合匹配的方法修正,不能修正的直接删除;接着合并正常数据和修正数据,然后处理缺失值,根据与不完全变量的关系,将缺失值分为随机和非随机,再分别运用热卡填充法、多项式填补或均值填补方法进行缺失值填补。该方法不仅能提高数据质量,而且还能提高数据的二次利用价值。
申请公布号 CN105488736A 申请公布日期 2016.04.13
申请号 CN201510869111.0 申请日期 2015.12.02
申请人 国家电网公司;国网青海省电力公司;国网青海省电力公司电力科学研究院;清华大学 发明人 王东方;赵争鸣;张海宁;杨晟;李春来;杜贵兰;李正曦;赵越;杨立滨;杨军;张节潭;孟可风;贾昆;赵世昌
分类号 G06Q50/06(2012.01)I;G06Q10/00(2012.01)I 主分类号 G06Q50/06(2012.01)I
代理机构 武汉帅丞知识产权代理有限公司 42220 代理人 朱必武;周瑾
主权项  一种用于光伏电站数据采集系统的数据处理方法,其特征在于,包括以下步骤:(1)在保证数据的完整性下,将数据分为正常数据和异常数据,通过对异常数据进行分析和校验,把异常数据分为人为原因和系统原因;A: 人为原因用判断域值的方法修正,即根据日常规定或者经验来进行修正;若不能修正,则直接删除;B: 系统原因用变量联合匹配的方法修正,即找到与异常数据变量相关联的变量进行修正;若不能修正,则直接删除;(2)合并正常数据和修正数据,然后处理缺失值,根据与不完全变量的关系,将缺失值分为随机缺失和非随机缺失;A:随机缺失是数据的缺失仅仅依赖于完全变量的缺失值,用热卡填充法在完全数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充;B:非随机缺失是不完全变量中数据的缺失依赖于不完全变量本身,非随机缺失变量分为字符型和数值型;字符型变量采用多项式填补法来进行填补,数值型变量采用均值填补法进行填补;(3)通过以上步骤即完成光伏电站数据采集系统的数据处理。
地址 100031 北京市西城区西长安街86号