发明名称 基于电力用户数据的数据归整处理方法
摘要 本发明涉及一种基于电力用户数据的数据归整处理方法,包括以下步骤:1)基于时间序列三维坐标,建立数据坐标,找到XYZ三个方向的规律,将所有缺失点均表示为零数据;2)进行牛顿插值,设置阈值,不断比对修正在阈值以外的数据点;3)通过离散型变量方差、独立性检验统计量计算得到数据的特征以及数据点与点之间的特征,采用数据连续化方法,将离散型数据变成连续型数据,采用MATLAB工具将其画成负荷曲线。与现有技术相比,本发明具有将用户数据进行合理的修正,得到接近于实际数据的近似数据值,从而可以很好为今后的数据应用打下基础等优点。
申请公布号 CN103236025B 申请公布日期 2016.05.04
申请号 CN201310148052.9 申请日期 2013.04.25
申请人 国家电网公司;上海市电力公司;华东电力试验研究院有限公司 发明人 张浙波;罗祾;金家培;童旭
分类号 G06F19/00(2011.01)I;G06Q50/06(2012.01)I 主分类号 G06F19/00(2011.01)I
代理机构 上海科盛知识产权代理有限公司 31225 代理人 赵志远
主权项 一种基于电力用户数据的数据归整处理方法,其特征在于,包括以下步骤:1)基于时间序列三维坐标,建立数据坐标,找到XYZ三个方向的规律,将所有缺失点均表示为零数据;2)进行牛顿插值,设置阈值,不断比对修正在阈值以外的数据点;3)通过离散型变量方差、独立性检验统计量计算得到数据的特征以及数据点与点之间的特征,采用数据连续化方法,将离散型数据变成连续型数据,采用MATLAB工具将其画成负荷曲线;所述的步骤1)具体如下:11)按照时间规律对历史数据进行分拆和排列,最终形成以周、月、年三种不同时间周期的数据排列模式,作为数据三维坐标;12)得到XYZ三个不同方向的数据列,从而在三个方向下分别找到数据规律,找出数据表格中的缺失数据,将所有缺失数据设置为0数据,全部代入数据表格中,得到完整数据表;所述的步骤2)具体如下:11)设置阈值,通过牛顿插值法进行计算,如公式(1)所示,f(x)=f(x<sub>0</sub>)+f[x<sub>0</sub>,x<sub>1</sub>](x‑x<sub>0</sub>)+…+f[x<sub>0</sub>,x<sub>1</sub>,…x<sub>n</sub>](x‑x<sub>0</sub>)(x‑x<sub>1</sub>)…(x‑x<sub>n</sub>)+P<sub>n</sub>(x)(1)其中<img file="FDA0000878814360000011.GIF" wi="703" he="125" />为牛顿插值余项,f[x<sub>0</sub>,x<sub>1</sub>,…x<sub>n</sub>]为牛顿插值多项式系数,<maths num="0001"><math><![CDATA[<mrow><mi>f</mi><mo>&lsqb;</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mi>n</mi></msub><mo>&rsqb;</mo><mo>=</mo><mfrac><mrow><mi>f</mi><mo>&lsqb;</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>&rsqb;</mo><mo>-</mo><mi>f</mi><mo>&lsqb;</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mi>n</mi></msub><mo>&rsqb;</mo></mrow><mrow><msub><mi>x</mi><mn>0</mn></msub><mo>-</mo><msub><mi>x</mi><mi>n</mi></msub></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000878814360000012.GIF" wi="941" he="138" /></maths>x为数据坐标轴的横坐标,f(x)为数据坐标轴的纵坐标;12)判断计算值f(x)与真实值y之间的差值是否大于设定阈值,若为是,将真实值y修正为f(x),否则保留真实值y;所述的步骤3)中的离散型变量方差、独立性检验统计量的计算如下:a、离散型变量方差:Var(X)=σ<sup>2</sup>=∑(x‑μ)<sup>2</sup>p(x)其中,<img file="FDA0000878814360000013.GIF" wi="425" he="135" />E(X)为数据X的期望,p(x)为数据点x的概率;b、独立性检验统计量:<maths num="0002"><math><![CDATA[<mrow><msup><mi>x</mi><mn>2</mn></msup><mo>=</mo><munder><mi>&Sigma;</mi><mi>i</mi></munder><munder><mi>&Sigma;</mi><mi>j</mi></munder><mfrac><msup><mrow><mo>(</mo><msub><mi>f</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>e</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>e</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mfrac><mo>,</mo><mi>d</mi><mi>f</mi><mo>=</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mrow><mo>(</mo><mi>C</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000878814360000021.GIF" wi="812" he="177" /></maths>其中,f<sub>ij</sub>为数据表中的第i行第j列类别的观察频数,e<sub>ij</sub>为数据表中的第i行第j列类别的期望频数。
地址 100031 北京市西城区西长安街86号