发明名称 一种改进BP神经网络估值的缺失数据轴承故障诊断方法
摘要 一种改进BP神经网络估值的缺失数据轴承故障诊断方法,步骤如下:1)轴承数据预处理;2)确定和优化训练样本;3)初始化网络;4)改进后基于缺失数据的BP网络的训练;5)对缺失属性进行估值;6)对数据集进行聚类分析,运用本发明方法能够对存在缺失的轴承数据进行处理,采用模糊C均值聚类算法对恢复后的完整数据集进行聚类,从而对轴承健康度进行评价。
申请公布号 CN104751229A 申请公布日期 2015.07.01
申请号 CN201510172600.0 申请日期 2015.04.13
申请人 辽宁大学 发明人 张利;王蓓蕾;刘萌萌;夏天;王鹭;王军;孙颖
分类号 G06N3/08(2006.01)I 主分类号 G06N3/08(2006.01)I
代理机构 沈阳杰克知识产权代理有限公司 21207 代理人 罗莹
主权项 一种改进BP神经网络估值的缺失数据轴承故障诊断方法,其特征在于,步骤如下:1)轴承数据预处理:将采集到的滚动轴承的原始数据进行特征提取,选取其中的9个特征,并将确定的滚动轴承数据进行人工随机缺失处理,得到缺失样本;2)确定和优化训练样本:采用局部距离公式(1)计算每个缺失样本与其他所有样本的相似度,将得到的相似度从大到小排列,为每个缺失属性选取相似度最大的样本作为相应的预训练样本集,再针对每个样本缺失属性的位置对其预训练样本集中数据的相应属性做缺失处理,将处理后的数据集作为训练样本集,训练样本集作为网络的输入,同时每个输入值也作为网络的期望输出Y;局部距离公式如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>D</mi><mi>ba</mi></msub><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msub><mi>I</mi><mi>i</mi></msub></mrow></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>s</mi></munderover><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>ia</mi></msub><mo>-</mo><msub><mi>x</mi><mi>ib</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mo>=</mo><mi>i</mi><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>s</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000011.GIF" wi="1743" he="220" /></maths><img file="FDA0000698220570000012.GIF" wi="1746" he="174" />其中,对于缺失数据集<img file="FDA0000698220570000013.GIF" wi="372" he="99" /><img file="FDA0000698220570000014.GIF" wi="57" he="77" />与<img file="FDA0000698220570000015.GIF" wi="50" he="77" />均是<img file="FDA0000698220570000016.GIF" wi="42" he="74" />中的数据样本,x<sub>ia</sub>和x<sub>ib</sub>分别是<img file="FDA0000698220570000017.GIF" wi="58" he="75" />和<img file="FDA0000698220570000018.GIF" wi="46" he="72" />的第i个属性,s表示样本属性的数目,N表示数据集中样本的总数;3)初始化网络:根据选取的缺失轴承数据训练样本集来确定网络输入层节点数n=9,隐含层节点数l=14,输出层节点数m=9;初始化输入层,隐含层和输出层神经元之间的连接权值w<sub>ij</sub>,w<sub>jk</sub>,初始化隐含层阈值a和输出层阈值b,给定学习速率和神经元激励函数,确定最大训练次数M,误差精度ε<sub>1</sub>;4)改进后基于缺失数据的BP网络的训练:运用每个缺失属性的训练样本集对改进的BP网络进行训练,得到针对每个缺失属性训练的神经网络,获得相应的权值w<sub>ij</sub>,w<sub>jk</sub>和阈值a,b:4a)隐含层输出计算:根据训练样本输入向量<img file="FDA0000698220570000021.GIF" wi="86" he="90" />输入层和隐含层之间的连接权值w<sub>ij</sub>以及隐含层阈值a,计算隐含层输出H;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>H</mi><mi>j</mi></msub><mo>=</mo><mi>f</mi><mrow><mo>(</mo><mfrac><mi>n</mi><mi>I</mi></mfrac><mrow><mo>(</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>w</mi><mi>ij</mi></msub><msub><mi>x</mi><mi>i</mi></msub><msub><mi>I</mi><mi>i</mi></msub><mo>-</mo><msub><mi>a</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>l</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000022.GIF" wi="1640" he="148" /></maths>且<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>I</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>I</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000023.GIF" wi="1569" he="150" /></maths><img file="FDA0000698220570000024.GIF" wi="1632" he="174" />式中,n表示输入层节点数,l表示隐含层节点数,<img file="FDA0000698220570000025.GIF" wi="43" he="66" />是训练样本集<img file="FDA0000698220570000026.GIF" wi="61" he="73" />中的一个数据样本,x<sub>i</sub>表示数据样本<img file="FDA0000698220570000027.GIF" wi="44" he="62" />的第i个属性,<img file="FDA0000698220570000028.GIF" wi="52" he="116" />为输入层节点数目恢复系数,f为隐含层激励函数,激励函数为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>x</mi></mrow></msup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000029.GIF" wi="1645" he="141" /></maths>4b)输出层计算输出:根据隐含层输出H,连接权值w<sub>jk</sub>和阈值b,计算输出层的预测输出O;<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>O</mi><mi>k</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>l</mi></munderover><msub><mi>H</mi><mi>j</mi></msub><msub><mi>w</mi><mi>jk</mi></msub><mo>-</mo><msub><mi>b</mi><mi>k</mi></msub><mo>,</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mi>m</mi><mo>;</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006982205700000210.GIF" wi="1652" he="166" /></maths>式中,l表示隐含层节点数,m表示输出层节点数;4c)误差计算:根据网络预测输出O和期望输出Y,计算网络预测误差e;<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>e</mi><mi>k</mi></msub><mo>=</mo><mfrac><mi>m</mi><mi>I</mi></mfrac><mrow><mo>(</mo><msub><mi>Y</mi><mi>k</mi></msub><msub><mi>I</mi><mi>k</mi></msub><mo>-</mo><msub><mi>O</mi><mi>k</mi></msub><msub><mi>I</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>,</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mi>m</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000031.GIF" wi="1596" he="133" /></maths>且<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msub><mi>I</mi><mi>k</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>I</mi><mi>k</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000032.GIF" wi="1544" he="164" /></maths><img file="FDA0000698220570000033.GIF" wi="1615" he="181" />式中,m表示输出层节点数,Y<sub>k</sub>表示期望输出数据样本<img file="FDA0000698220570000034.GIF" wi="58" he="74" />的第k个属性,O<sub>k</sub>表示预测输出数据<img file="FDA0000698220570000035.GIF" wi="50" he="78" />的第k个属性,<img file="FDA0000698220570000036.GIF" wi="59" he="120" />为输出层节点数目恢复系数。4d)权值更新:根据网络预测误差e更新连接权值w<sub>ij</sub>和w<sub>jk</sub>;<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>w</mi><mi>ij</mi></msub><mo>=</mo><msub><mi>w</mi><mi>ij</mi></msub><mo>+</mo><mi>&eta;</mi><msub><mi>H</mi><mi>j</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>H</mi><mi>j</mi></msub><mo>)</mo></mrow><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>I</mi><mi>i</mi></msub><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>w</mi><mi>jk</mi></msub><msub><mi>e</mi><mi>k</mi></msub><mo>,</mo><mi>i</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mi>n</mi><mo>;</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>l</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>11</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000037.GIF" wi="1615" he="150" /></maths><img file="FDA0000698220570000038.GIF" wi="1632" he="179" />w<sub>jk</sub>=w<sub>jk</sub>+ηH<sub>j</sub>e<sub>k</sub>,j=1,2,...,l;k=1,2,...m;   (13)式中,n表示输入层节点数,l表示隐含层节点数,m表示输出层节点数,x(i)表示数据样本<img file="FDA00006982205700000310.GIF" wi="35" he="57" />的第i个属性,η=0.1为学习速率。4e)阈值更新:根据网络预测误差e更新网络节点阈值a,b;<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>a</mi><mi>j</mi></msub><mo>=</mo><msub><mi>a</mi><mi>j</mi></msub><mo>+</mo><mi>&eta;</mi><msub><mi>H</mi><mi>j</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>H</mi><mi>j</mi></msub><mo>)</mo></mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>w</mi><mi>jk</mi></msub><msub><mi>e</mi><mi>k</mi></msub><mo>,</mo><mi>j</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>l</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>14</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000698220570000039.GIF" wi="1741" he="154" /></maths>b<sub>k</sub>=b<sub>k</sub>+e<sub>k</sub>,k=1,2,...m   (15)4f)算法终止条件判定:当e<ε<sub>1</sub>或者训练次数大于最大训练次数M时,得到相应的权值和阈值,转到步骤4g);否则,则返回步骤4a);4g)利用步骤4f)得到的针对相应缺失属性训练的网络的权值和阈值,对隐含层和输出层节点之间的连接权值w<sub>ij</sub>和w<sub>jk</sub>,隐含层阈值a和输出层阈值b进行赋值;5)对缺失属性进行估值:利用训练好的改进BP网络对每个缺失属性进行估值,进而将缺失数据恢复完整,最后得到恢复完整后的滚动轴承数据集:5a)将得到的w<sub>ij</sub>和隐含层阈值a带入公式(3)计算隐含层输出H;5b)将得到的隐含层输出H、权值w<sub>jk</sub>和输出层阈值b带入公式(7),从得到的输出层输出值中获取相应缺失属性的估计值,将整个缺失数据集填补成完整数据集;6)对数据集进行聚类分析:利用模糊C均值算法对恢复完整后的滚动轴承数据集进行聚类,最终得到轴承数据的故障分类结果。
地址 110000 辽宁省沈阳市沈北新区道义南大街58号