基于电力用户数据的数据归整处理方法,申请号CN201310148052.9-传众专利搜索

发明名称	基于电力用户数据的数据归整处理方法
摘要	本发明涉及一种基于电力用户数据的数据归整处理方法，包括以下步骤：1)基于时间序列三维坐标，建立数据坐标，找到XYZ三个方向的规律，将所有缺失点均表示为零数据；2)进行牛顿插值，设置阈值，不断比对修正在阈值以外的数据点；3)通过离散型变量方差、独立性检验统计量计算得到数据的特征以及数据点与点之间的特征，采用数据连续化方法，将离散型数据变成连续型数据，采用MATLAB工具将其画成负荷曲线。与现有技术相比，本发明具有将用户数据进行合理的修正，得到接近于实际数据的近似数据值，从而可以很好为今后的数据应用打下基础等优点。
申请公布号	CN103236025B	申请公布日期	2016.05.04
申请号	CN201310148052.9	申请日期	2013.04.25
申请人	国家电网公司;上海市电力公司;华东电力试验研究院有限公司	发明人	张浙波;罗祾;金家培;童旭
分类号	G06F19/00(2011.01)I;G06Q50/06(2012.01)I	主分类号	G06F19/00(2011.01)I
代理机构	上海科盛知识产权代理有限公司 31225	代理人	赵志远
主权项	一种基于电力用户数据的数据归整处理方法，其特征在于，包括以下步骤：1)基于时间序列三维坐标，建立数据坐标，找到XYZ三个方向的规律，将所有缺失点均表示为零数据；2)进行牛顿插值，设置阈值，不断比对修正在阈值以外的数据点；3)通过离散型变量方差、独立性检验统计量计算得到数据的特征以及数据点与点之间的特征，采用数据连续化方法，将离散型数据变成连续型数据，采用MATLAB工具将其画成负荷曲线；所述的步骤1)具体如下：11)按照时间规律对历史数据进行分拆和排列，最终形成以周、月、年三种不同时间周期的数据排列模式，作为数据三维坐标；12)得到XYZ三个不同方向的数据列，从而在三个方向下分别找到数据规律，找出数据表格中的缺失数据，将所有缺失数据设置为0数据，全部代入数据表格中，得到完整数据表；所述的步骤2)具体如下：11)设置阈值，通过牛顿插值法进行计算，如公式(1)所示，f(x)＝f(x<sub>0</sub>)+f[x<sub>0</sub>,x<sub>1</sub>](x‑x<sub>0</sub>)+…+f[x<sub>0</sub>,x<sub>1</sub>,…x<sub>n</sub>](x‑x<sub>0</sub>)(x‑x<sub>1</sub>)…(x‑x<sub>n</sub>)+P<sub>n</sub>(x)(1)其中<img file="FDA0000878814360000011.GIF" wi="703" he="125" />为牛顿插值余项，f[x<sub>0</sub>,x<sub>1</sub>,…x<sub>n</sub>]为牛顿插值多项式系数，<maths num="0001"><math><![CDATA[<mrow><mi>f</mi><mo>[</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mi>n</mi></msub><mo>]</mo><mo>=</mo><mfrac><mrow><mi>f</mi><mo>[</mo><msub><mi>x</mi><mn>0</mn></msub><mo>,</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>]</mo><mo>-</mo><mi>f</mi><mo>[</mo><msub><mi>x</mi><mn>1</mn></msub><mo>,</mo><mo>...</mo><msub><mi>x</mi><mi>n</mi></msub><mo>]</mo></mrow><mrow><msub><mi>x</mi><mn>0</mn></msub><mo>-</mo><msub><mi>x</mi><mi>n</mi></msub></mrow></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000878814360000012.GIF" wi="941" he="138" /></maths>x为数据坐标轴的横坐标，f(x)为数据坐标轴的纵坐标；12)判断计算值f(x)与真实值y之间的差值是否大于设定阈值，若为是，将真实值y修正为f(x)，否则保留真实值y；所述的步骤3)中的离散型变量方差、独立性检验统计量的计算如下：a、离散型变量方差：Var(X)＝σ<sup>2</sup>＝∑(x‑μ)<sup>2</sup>p(x)其中，<img file="FDA0000878814360000013.GIF" wi="425" he="135" />E(X)为数据X的期望，p(x)为数据点x的概率；b、独立性检验统计量：<maths num="0002"><math><![CDATA[<mrow><msup><mi>x</mi><mn>2</mn></msup><mo>=</mo><munder><mi>Σ</mi><mi>i</mi></munder><munder><mi>Σ</mi><mi>j</mi></munder><mfrac><msup><mrow><mo>(</mo><msub><mi>f</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>-</mo><msub><mi>e</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>e</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mfrac><mo>,</mo><mi>d</mi><mi>f</mi><mo>=</mo><mrow><mo>(</mo><mi>R</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mrow><mo>(</mo><mi>C</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000878814360000021.GIF" wi="812" he="177" /></maths>其中，f<sub>ij</sub>为数据表中的第i行第j列类别的观察频数，e<sub>ij</sub>为数据表中的第i行第j列类别的期望频数。
地址	100031 北京市西城区西长安街86号