发明名称 一种不均衡数据SVM轴承故障检测方法
摘要 本发明的目的在于提供一种不均衡数据SVM轴承故障检测方法,包括以下步骤:收集振动信号,确定嵌入维数和延迟的时间间隔,重构正常样本相空间,确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,对SVM检测器进行训练,调整需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,再放入SVM检测器进行训练,直至检测性能指标达到0.6,将待测试的轴承数据样本输入到SVM检测器中,实现滚动轴承故障检测。本发明对数据样本采样进行改进,具有较强的去除正常状态样本中的冗余信息和噪声能力,进而提高不均衡数据SVM轴承故障检测器的检测性能。
申请公布号 CN102254177B 申请公布日期 2013.06.05
申请号 CN201110101842.2 申请日期 2011.04.22
申请人 哈尔滨工程大学 发明人 陶新民;宋少宇;童智靖
分类号 G06F17/00(2006.01)I;G06K9/62(2006.01)I;G01H17/00(2006.01)I 主分类号 G06F17/00(2006.01)I
代理机构 代理人
主权项 1.一种不均衡数据SVM轴承故障检测方法,其特征是:(1)利用安装在感应电动机输出轴的传感器收集振动信号;(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔,采用时间延迟技术重构正常类样本空间,故障类样本在所述的正常类样本空间的投影系数为故障特征;(3)α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;BSMOTE算法具体过程如下:定义训练数据集是S,故障类样本集是F={f<sub>1</sub>,f<sub>2</sub>,…,f<sub>n</sub>};①计算每一个故障类样本f<sub>i</sub>(i=1,2,…n)在训练数据集S中的k个最近邻,然后利用这k个最近邻对F中的样本进行归类:如果这k个最近邻全是正常类样本,那么认为该样本为噪声样本,将它保存在N′集合中;反之如果k个最近邻都是故障类样本,则认为该样本是远离分类边界样本将其保存在S′集合中;如果这k个最近邻中既有故障类样本又有正常类样本,则认为该样本是边界样本,存放在B集合中;②设<img file="FDA00002348283300011.GIF" wi="338" he="47" />计算集合B中每一个样本<img file="FDA00002348283300012.GIF" wi="49" he="47" />i=1,2,…b在F中的k′个最近邻f<sub>ij</sub>,j=1,2,…k′,然后随机选出s个最近邻样本,其中1<s<b,分别求出它们与该样本之间全部属性的差值d<sub>ij′</sub>:<img file="FDA00002348283300013.GIF" wi="246" he="54" />j′=1,2,…s,并乘以一个随机数r<sub>ij′</sub>,r<sub>ij′</sub>∈(0,1),如果f<sub>ij′</sub>是N′集合或是S′集合中的样本则r<sub>ij′</sub>∈(0,0.5),最后合成的人工故障类样本为:<maths num="0001"><![CDATA[<math><mrow><msub><mi>h</mi><msup><mi>ij</mi><mo>&prime;</mo></msup></msub><mo>=</mo><msubsup><mi>f</mi><mi>i</mi><mo>&prime;</mo></msubsup><mo>+</mo><msub><mi>r</mi><msup><mi>ij</mi><mo>&prime;</mo></msup></msub><mo>&times;</mo><msub><mi>d</mi><msup><mi>ij</mi><mo>&prime;</mo></msup></msub><mo>,</mo><msup><mi>j</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mi>s</mi><mo>;</mo></mrow></math>]]></maths>③重复步骤②中人工故障类样本的生成过程,直到生成的故障类样本数目满足要求后,算法结束;ODR算法具体过程如下:定义训练样本集为T,正常类样本集为N,p是正常类样本,即是N集中的样本,定义p的关联集是指N集中的其余样本的k个最近邻中含有样本p的样本集合,关联集用A<sub>p</sub>={n<sub>p1</sub>,n<sub>p2</sub>,…n<sub>pn</sub>}表示,其中p为n<sub>pi</sub>的最近邻,其中n<sub>pi</sub>∈A<sub>p</sub>,对立样本指的是样本类型和p不一致的样本,1)利用K值最近邻算法寻找训练样本集T中每一个样本的t个最近邻,建立每一个样本的最近邻链表,根据所有样本的最近邻链表创建正常类样本的关联集链表;2)正常类样本集N中的每一个样本p,对p的关联集中的样本根据K值最近邻算法进行分类,正确分类的个数记withp;将样本p从这些样本的最近邻链表中删除,使用这些样本各自的第t+1个最近邻代替,此时能够被K值最近邻算法正确分类的个数,记withoutp;3)根据withp和withoutp的值确定是否删除样本p:假如withp≤withoutp,则认为删除p后对训练样本集T分类的影响较小,反之withp>withoutp时,认为删除p对分类的影响较大;4)计算正常类样本集N中每一个样本在训练样本集T中距离最近的对立样本,并求出两者之间的欧式距离<img file="FDA00002348283300021.GIF" wi="70" he="58" />5)根据withp-withoutp的值从大到小对正常类样本进行排列,假如两个正常类样本的withp-withoutp值相同,则按各自的<img file="FDA00002348283300022.GIF" wi="48" he="58" />值从大到小的顺序将其排列,然后依次删除正常类样本,直到正常类样本的数目达到指定的数目时,则算法结束;(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0.6,所述的检测性能指标为几何平均率G:<img file="FDA00002348283300023.GIF" wi="274" he="55" />其中P是正常类样本检测正确率,M是故障类样本检测正确率;(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。
地址 150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室