一种基于海量数据挖掘的设备状态预测方法,申请号CN201110286146.3-传众专利搜索

发明名称	一种基于海量数据挖掘的设备状态预测方法
摘要	本发明属于基于工业设备海量数据的数据挖掘领域，提供一种设备状态预测方法，该方法从历史数据中充分挖掘有用知识，结合设备实时情况对设备状态进行的有效的预测，能在较低开销下以较高的效率完成知识学，并且实时的给出设备状态的预测与诊断结果，为企业实现大型设备的状态监测、预警诊断等起到良好的作用。
申请公布号	CN103020006B	申请公布日期	2016.09.07
申请号	CN201110286146.3	申请日期	2011.09.24
申请人	国家电网公司;江苏瑞中数据股份有限公司	发明人	唐胜;胡洁
分类号	G06F15/18(2006.01)I;G06K9/62(2006.01)I	主分类号	G06F15/18(2006.01)I
代理机构	南京知识律师事务所 32207	代理人	汪旭东
主权项	一种基于海量数据挖掘的设备状态预测方法，其特征在于：包括阶段一：学习算法；阶段二：预测算法；所述阶段一：学习算法包括步骤如下：反映设备历史运行状态的数据样本作为训练数据集D＝(o<sub>1</sub>,o<sub>2</sub>,…,o<sub>m</sub>)，聚类结果的类集合为C，其中，<img file="FDA0001038055810000011.GIF" wi="283" he="49" />o<sub>i</sub>＝(o<sub>i1</sub>,…,o<sub>ik</sub>,…o<sub>in</sub>),n≥1,1≤k≤n,v<sub>ik</sub>为数据集D中向量o<sub>i</sub>的第k维参数的值，n为每个数据向量的维度；步骤1，初始化：C＝φ，读入第一个训练数据向量并对其标准化，记录结果为o<sub>1</sub>，生成初始聚类C<sub>1</sub>，并记录聚类上限和聚类下限，C＝{C<sub>1</sub>}；步骤2，处理新数据向量：读入一个新的训练数据向量并对其标准化，记录结果为o<sub>2</sub>，如果<img file="FDA0001038055810000012.GIF" wi="198" he="63" />使得distance(o<sub>i</sub>,C<sub>j</sub>)＝0，那么转至步骤3，否则转至步骤4；步骤3，o<sub>i</sub>并入C<sub>j</sub>：C<sub>j</sub>＝C<sub>j</sub>∪o<sub>i</sub>，同时更新C<sub>j</sub>的参数，现有的类总个数不变；步骤4，o<sub>i</sub>自成一类：由C<sub>n+1</sub>＝{o<sub>i</sub>}，C＝C∪C<sub>n+1</sub>其中n为聚类结果集中聚类的个数；步骤5：所有历史训练数据向量都已经处理完，阶段一终止；否则，返回步骤2；阶段二：预测算法包括如下步骤：步骤6，初始化：i＝0；步骤7，计算距离：计算向量o与聚类结果集C＝{C<sub>1</sub>,C<sub>2</sub>,…,C<sub>m</sub>}中聚类的距离，若d<sub>i</sub>＝0，转至步骤9；若i＝m，转至步骤8；否则，令i＝i+1，转至步骤7；步骤8，寻找最近距离：从距离集合d＝{d<sub>1</sub>,d<sub>2</sub>,…,d<sub>m</sub>}中找到一个d<sub>i</sub>，使得d<sub>i</sub>为集合d中的最小值；步骤9，确定相似模型：根据d<sub>i</sub>确定聚类模型在聚类结果集中的序号为i，即相似的聚类模型为C<sub>i</sub>；步骤10，计算预测向量：根据聚类模型C<sub>i</sub>得到向量o的预测向量o'。
地址	100031 北京市西城区西长安街86号