发明名称 一种用于模式分类的特征选择方法
摘要 本发明公开了一种用于模式分类的特征选择方法,通过采用模糊Fisher准则为目标函数求得无监督最佳鉴别矢量的基础上,根据该矢量中每一维的值求得每个特征重要性权值,按照该权值大小进行特征排序,通过给定阈值,选取特征子集,进而实现了特征降维。本发明的方法的实施不仅无需事先提供样本类别信息,而且有效解决了无监督模式下特征选择缺乏分离性度量的问题,在UCI数据集及故障诊断实验中体现了良好的降维性能,具有很高的实用价值。
申请公布号 CN103425994A 申请公布日期 2013.12.04
申请号 CN201310304574.3 申请日期 2013.07.19
申请人 淮阴工学院 发明人 曹苏群;朱全银;左晓明;高尚兵;陈晓峰;张虹;杨格兰;陈召兴
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京天华专利代理有限责任公司 32218 代理人 徐冬涛
主权项 1.一种用于模式分类的特征选择方法,其特征在于:通过采用模糊Fisher准则为目标函数求得无监督最佳鉴别矢量的基础上,根据该矢量中每一维的值求得每个特征重要性权值,按照该权值大小进行特征排序,通过给定阈值,选取特征子集,进而实现数据降维;具体包括以下各步骤:A、将原始数据转换为N×d矩阵,其中N为样本个数,d为特征维数;B、给定阈值ε或迭代次数α,给定特征重要性阈值θ;C、使用k-means算法初始化隶属矩阵U=[μ<sub>ij</sub>]<sub>c×N</sub>以及聚类中心m=(m<sub>1</sub>,m<sub>2</sub>,...,m<sub>c</sub>),其中u<sub>ij</sub>表示第j个样本属于第i类的程度,c为分割聚类数目,此处i、j为变量且取值区间分别为:[1,c]、[1,N],设m为模糊指数且m&gt;1;D、使用以下公式分别计算模糊类内散布矩阵S<sub>fw</sub>、模糊类间散布矩阵S<sub>fb</sub>:<maths num="0001"><![CDATA[<math><mrow><msub><mi>S</mi><mi>fw</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>S</mi><mi>fb</mi></msub><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>其中隶属度函数u<sub>ij</sub>∈[0,1]且<img file="FDA00003535409100013.GIF" wi="222" he="142" />x<sub>j</sub>为N维列向量,在样本空间定义各类样本均值向量记为m<sub>i</sub>,<img file="FDA00003535409100014.GIF" wi="52" he="60" />为所有样本均值,T表示矩阵转置;E、使用以下公式求得矩阵<img file="FDA00003535409100015.GIF" wi="165" he="85" />最大特征值λ对应的模为1的特征向量ω:<maths num="0003"><![CDATA[<math><mrow><msubsup><mi>S</mi><mi>fw</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>S</mi><mi>fb</mi></msub><mi>&omega;</mi><mo>=</mo><mi>&lambda;&omega;</mi></mrow></math>]]></maths>该公式为求一般矩阵<img file="FDA00003535409100017.GIF" wi="136" he="88" />的特征值问题,其中λ取该矩阵的最大特征值,而ω为λ对应的特征向量;F、使用以下公式分别计算新的m<sub>i</sub>和μ<sub>ij</sub>:<maths num="0004"><![CDATA[<math><mrow><msub><mi>m</mi><mi>i</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>其中m<sub>i</sub>是局部解,<maths num="0005"><![CDATA[<math><mrow><msub><mi>u</mi><mi>ij</mi></msub><mo>=</mo><mfrac><msup><mrow><mo>(</mo><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi><mo>-</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></mrow></msup><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msup><mrow><mo>(</mo><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>k</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi><mo>-</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>k</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>k</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></mrow></msup></mrow></mfrac></mrow></math>]]></maths>其中k为变量且取值区间分别为:[1,c],在模糊聚类中,通常限定u<sub>ij</sub>∈[0,1],因此对上式给出如下限定条件,若:<maths num="0006"><![CDATA[<math><mrow><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi><mo>&le;</mo><mfrac><mn>1</mn><mi>&lambda;</mi></mfrac><msup><mi>&omega;</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>&omega;</mi></mrow></math>]]></maths>则:u<sub>ij</sub>=1且对所有i′≠i,有u<sub>i′j</sub>=0;G、使用以下公式计算J<sub>FFC</sub>并将迭代次数自增1:<maths num="0007"><![CDATA[<math><mrow><msub><mi>J</mi><mi>FFC</mi></msub><mo>=</mo><mfrac><mrow><msup><mi>&omega;</mi><mi>T</mi></msup><msub><mi>S</mi><mi>fb</mi></msub><mi>&omega;</mi></mrow><mrow><msup><mi>&omega;</mi><mi>T</mi></msup><msub><mi>S</mi><mi>fw</mi></msub><mi>&omega;</mi></mrow></mfrac></mrow></math>]]></maths>其中J<sub>FFC</sub>为模糊Fisher准则(Fuzzy Fisher Criterion)函数;H、按照预先设定的条件进行判断,如预先设定的条件得到满足,则转到步骤I,否则返回步骤D;I、使用以下公式计算各特征的重要性度量f<sub>k</sub>,并将特征按照f<sub>k</sub>降序排列:<maths num="0008"><![CDATA[<math><mrow><msub><mi>f</mi><mi>k</mi></msub><mo>=</mo><mfrac><mrow><mo>|</mo><msub><mi>&omega;</mi><mi>k</mi></msub><mo>|</mo></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>d</mi></munderover><mo>|</mo><msub><mi>&omega;</mi><mi>k</mi></msub><mo>|</mo></mrow></mfrac></mrow></math>]]></maths>其中定义f<sub>k</sub>为第k个特征重要性度量,设ω=(ω<sub>1</sub>,ω<sub>2</sub>,…ω<sub>d</sub>)′;J、在降序排列的特征中寻找前d<sub>θ</sub>个特征作为降维后特征,使得<img file="FDA00003535409100025.GIF" wi="174" he="126" />且d<sub>θ</sub>最小,从而实现降维,算法结束。
地址 223003 江苏省淮安市高教园区枚乘东路1号