发明名称 一种基于大数据的电力项目规划建设方法
摘要 一种基于大数据的电力项目规划建设方法。利用电力系统及其他系统海量的历史大数据,首先通过连续属性离散化的方法,将连续属性的数据转换成离散化数据。再通过一个通用的聚类方法,提供多个模型挖掘出典型的用户电力数据特征。此聚类方法通过参数<i>a</i>和<i>b</i>的取值来调节FCM和PCM占混合模型的权重,以达到发挥各自模型的优势,以便更好地挖掘出典型用户的电力数据特征。依据支持度和置信度对电力系统中挖掘出的有用信息排序,形成电力项目规划建设指导书。为指导电力项目规划、建设和改造提供科学的依据。
申请公布号 CN105303470A 申请公布日期 2016.02.03
申请号 CN201510834620.X 申请日期 2015.11.26
申请人 国网辽宁省电力有限公司大连供电公司;国家电网公司 发明人 王跃东;杨超;刘林;章晓宁;王晓琳;张成文;高宁;梁辉;王强;王晓蕾
分类号 G06Q50/06(2012.01)I 主分类号 G06Q50/06(2012.01)I
代理机构 代理人
主权项 一种基于大数据的电力项目规划建设方法,其特征在于包括以下步骤:A、对各个系统数据库中的:用户所在的台区、缴费金额、缴费金额增长率、利润率、预付费、缴费渠道、缴费渠道覆盖等级、运营成本以及用户所在台区住户平均经济状况、个人经济状况、台区住户平均年龄、用户个人年龄等数据进行收集整理,整理数据的过程包括:A1.数据分类:将数据分为连续数据和非连续数据两大类;A2.数据量化:将文字表示的表述的因素根据该因素占所有因素的比例进行排序,借用排序的顺序进行表示,数值越大,表示所占比重越高。B、对缴费金额、缴费金额平均增长率、利润率、预付款、运用成本、台区平均年龄还有个人年龄这些连续的属性值,进行离散化,其步骤为:B.1.首先确定决策属性,其他属性作为条件属性,将决策表中决策属性与每一个条件属性都组成一个新的小表;B.2利用多线程技术实现离散化的并行处理。处理一个小表就占用一个线程;B.3.属性离散化,其相应步骤为:2.3.1.初始化断点集合、候选断点集、被断点分割子集以及决策表的信息熵;2.3.2。排序连续属性,将其候选断点集合假如到候选断点集中;2.3.3.计算候选断点集中每个断点的信息熵;2.3.4.如果该断点的信息熵大于决策表信息熵时,结束算法,反之则继续;2.3.5. 选择候选断点集中,信息熵最小的断点,将其加入到断点集合中,再从候选断点集中剔除该断点,将该断点的信息熵赋值给决策表的信息熵;2.3.6.用新断点重新对子集进行分割,如果能分成两部分,则将两部分子集代替原来子集;2.3.7.如果每个子集内部对应的决策属性值相同的话,结束,否则算法跳转至第3.3步继续执行;B.4.将所有小表处理的结果合成一个新的离散化的决策表;C、对于这个新的离散化的表,利用基于阴影集的粗糙C均值聚类算法算出具有代表性的典型用户(聚类中心),其步骤为:C.1.利用FCM算法初始化k个聚类中心;C.2.利用公式1计算对象的隶属度矩阵<img file="FDA0000858022140000021.GIF" wi="695" he="75" />其中<img file="FDA0000858022140000022.GIF" wi="975" he="185" />C.3.对每个模糊类簇,利用阴影集求阈值α<sub>i</sub>,使公式2取得最小值<img file="FDA0000858022140000023.GIF" wi="1750" he="77" />C.4.对每个模糊类簇C<sub>i</sub>,凡是隶属度大于α<sub>i</sub>的对象归类到C<sub>i</sub>的上近似<img file="FDA0000858022140000024.GIF" wi="94" he="86" />而隶属度大于1‑α<sub>i</sub>的对象归类到C<sub>i</sub>的下近似<u>C<sub>i</sub></u>;C.5.利用公式(3)计算目标函数的值<img file="FDA0000858022140000025.GIF" wi="871" he="134" />其中<img file="FDA0000858022140000026.GIF" wi="1278" he="94" /><img file="FDA0000858022140000031.GIF" wi="1503" he="199" />C.6.如果目标函数收敛或者满足其他终止条件,结束迭代过程,否则利用公式(4)<img file="FDA0000858022140000032.GIF" wi="790" he="136" />其中<img file="FDA0000858022140000033.GIF" wi="319" he="93" /><img file="FDA0000858022140000034.GIF" wi="733" he="202" />重新计算每个类簇的新的中心并重复执行步骤C.2)至C.5)。
地址 116001 辽宁省大连市中山区中山路102号