发明名称 一种基于数据挖掘的风力发电机组故障诊断方法
摘要 一种基于数据挖掘的风力发电机组故障诊断方法:S1对实时采集的风力发电机组参数消除数据噪声和处理空缺值;S2幅值域分析;S3相关性分析;S4对不同故障类型的数据样本建立故障判定树;S5对于创建好的故障判定树,采用后剪枝方法以消除数据中的噪声和孤立点带来的训练异常;S6提取后剪枝完的故障判定树表示的知识,以IF-THEN的形式给出故障判定规则;S7重复步骤S1、S2、S3,对处理后的数据利用步骤S6提取到的故障诊断规则进行故障诊断,并对诊断结果予以显示。本发明可及时并有效地确定风力发电机组发生故障的部件,确定故障类型及故障原因,防止故障恶化而产生重大事故。
申请公布号 CN102759711B 申请公布日期 2014.12.10
申请号 CN201210214246.X 申请日期 2012.06.27
申请人 广东电网公司电力科学研究院 发明人 冯永新;蒋东翔;杨涛;邓小文;陈杰;杨文广
分类号 G01R31/34(2006.01)I;G01M15/00(2006.01)I 主分类号 G01R31/34(2006.01)I
代理机构 广州知友专利商标代理有限公司 44104 代理人 周克佑
主权项 一种基于数据挖掘的风力发电机组故障诊断方法,包括以下步骤:S1对实时采集到的风力发电机组包括振动信号在内的参数进行数据预处理:消除数据噪声和处理空缺值;S2对经过步骤S1得到的风力发电机组振动信号进行幅值域分析;S3对实时采集到的风力发电机组性能参数和进行幅值域分析后得到的振动参数进行相关性分析,除去对故障诊断没有作用的冗余参数;S4对不同故障类型的数据样本建立故障判定树;S5对于创建好的故障判定树,采用后剪枝方法消除数据中的噪声和孤立点带来的训练异常;S6提取后剪枝完的故障判定树表示的知识,以IF‑THEN的形式给出故障判定规则;S7对实时采集到的风力发电机组运行参数,重复步骤S1、S2、S3,对处理后的数据利用步骤S6提取到的故障诊断规则进行故障诊断,并对诊断结果予以显示;所述的步骤S2中进行幅值域分析的振动信号包括:计算峰值、有效值、峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子参数;所述的步骤S4包括以下步骤:S4‑1创建节点S;S4‑2如果所有数据样本都属于同一故障类型A,则返回S作为叶节点,并标记为故障类型A;S4‑3否则,选择所有参数中具有最高信息增益的参数t,参数t成为节点S的“测试”参数;S4‑4对测试参数的每个区间划分创建一个分支,并据此划分样本;S4‑5重复以上过程,递归形成每个划分上的样本判定树;S4‑6递归划分步骤仅当下列条件之一成立时停止:给定节点的所有样本属于同一故障类型;没有剩余参数可以用来进一步划分样本;分支没有样本;所述的步骤S4‑3中选择所有参数中具有最高信息增益的参数t方法如下:设数据样本集合为{s<sub>1</sub>,s<sub>2</sub>,s<sub>3</sub>,…s<sub>n</sub>},故障类型共m种,分别为C<sub>1</sub>,C<sub>2</sub>,C<sub>3</sub>,…C<sub>m</sub>,属于不同故障类型的样本数据分别为q<sub>1</sub>,q<sub>2</sub>,q<sub>3</sub>,…q<sub>m</sub>,且满足∑q<sub>i</sub>=n;计算对给定样本分类所需的期望信息I为I=I(q<sub>1</sub>,q<sub>2</sub>,q<sub>3</sub>,…q<sub>m</sub>)=∑p<sub>i</sub>log<sub>2</sub>(p<sub>i</sub>)=∑(q<sub>i</sub>/s)log<sub>2</sub>(q<sub>i</sub>/s)对数据样本集合{s<sub>1</sub>,s<sub>2</sub>,s<sub>3</sub>,…s<sub>s</sub>}的参数r,构造集合R:{r<sub>1</sub>,r<sub>2</sub>,r<sub>3</sub>,…,r<sub>l</sub>},其中l≦s;用r<sup>*</sup>=(r<sub>i</sub>+r<sub>i+1</sub>)/2对集合和作一个划分:R<sub>1</sub>={r<sub>1</sub>,r<sub>2</sub>,r<sub>3</sub>,…r<sub>i</sub>},R<sub>2</sub>={r<sub>i+1</sub>,r<sub>i+2</sub>,r<sub>i+3</sub>,…,r<sub>l</sub>},使R<sub>1</sub>中的元素均小于r<sup>*</sup>,R<sub>2</sub>中的元素大于等于r<sup>*</sup>;分别统计属于R<sub>1</sub>、R<sub>2</sub>的样本中各故障类型的总数,分别记为r<sub>11</sub>,r<sub>12</sub>,r<sub>13</sub>,…,r<sub>1m</sub>;r<sub>21</sub>,r<sub>22</sub>,r<sub>23</sub>,…,r<sub>2m</sub>;对r<sup>*</sup>的划分计算子集的期望信息E:E=(r<sub>01</sub>)/s*∑(r<sub>1j</sub>/r<sub>01</sub>)*log<sub>2</sub>(r<sub>1j</sub>/r<sub>01</sub>)+(r<sub>02</sub>)/s*∑(r<sub>2j</sub>/r<sub>02</sub>)*log<sub>2</sub>(r<sub>2j</sub>/r<sub>02</sub>)其中r<sub>01</sub>=∑r<sub>1i</sub>,r<sub>02</sub>=∑r<sub>2i</sub>;遍历r<sup>*</sup>=(r<sub>i</sub>+r<sub>i+1</sub>)/2,i=1,2,3,…,l‑1.记使划分子集期望最大的r<sup>*</sup>为r<sup>*0</sup>,此时,对用参数r的r<sup>*0</sup>对集合{s<sub>1</sub>,s<sub>2</sub>,s<sub>3</sub>,…s<sub>s</sub>}进行划分,具有最大的信息增益;遍历所有参数,获得对集合{s<sub>1</sub>,s<sub>2</sub>,s<sub>3</sub>,…s<sub>s</sub>}具有最大信息增益的参数t和划分点t<sup>*0</sup>。
地址 510080 广东省广州市越秀区东风东路水均岗8号粤电大厦