一种用于模式分类的特征选择方法,申请号CN201310304574.3-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种用于模式分类的特征选择方法
摘要	本发明公开了一种用于模式分类的特征选择方法，通过采用模糊Fisher准则为目标函数求得无监督最佳鉴别矢量的基础上，根据该矢量中每一维的值求得每个特征重要性权值，按照该权值大小进行特征排序，通过给定阈值，选取特征子集，进而实现了特征降维。本发明的方法的实施不仅无需事先提供样本类别信息，而且有效解决了无监督模式下特征选择缺乏分离性度量的问题，在UCI数据集及故障诊断实验中体现了良好的降维性能，具有很高的实用价值。
申请公布号	CN103425994A	申请公布日期	2013.12.04
申请号	CN201310304574.3	申请日期	2013.07.19
申请人	淮阴工学院	发明人	曹苏群;朱全银;左晓明;高尚兵;陈晓峰;张虹;杨格兰;陈召兴
分类号	G06K9/62(2006.01)I	主分类号	G06K9/62(2006.01)I
代理机构	南京天华专利代理有限责任公司 32218	代理人	徐冬涛
主权项	1.一种用于模式分类的特征选择方法，其特征在于：通过采用模糊Fisher准则为目标函数求得无监督最佳鉴别矢量的基础上，根据该矢量中每一维的值求得每个特征重要性权值，按照该权值大小进行特征排序，通过给定阈值，选取特征子集，进而实现数据降维；具体包括以下各步骤：A、将原始数据转换为N×d矩阵，其中N为样本个数，d为特征维数；B、给定阈值ε或迭代次数α，给定特征重要性阈值θ；C、使用k-means算法初始化隶属矩阵U=[μ<sub>ij</sub>]<sub>c×N</sub>以及聚类中心m=(m<sub>1</sub>,m<sub>2</sub>,...,m<sub>c</sub>)，其中u<sub>ij</sub>表示第j个样本属于第i类的程度，c为分割聚类数目，此处i、j为变量且取值区间分别为:[1，c]、[1，N]，设m为模糊指数且m>1；D、使用以下公式分别计算模糊类内散布矩阵S<sub>fw</sub>、模糊类间散布矩阵S<sub>fb</sub>：<maths num="0001"><![CDATA[<math><mrow><msub><mi>S</mi><mi>fw</mi></msub><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><msub><mi>S</mi><mi>fb</mi></msub><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>其中隶属度函数u<sub>ij</sub>∈[0,1]且<img file="FDA00003535409100013.GIF" wi="222" he="142" />x<sub>j</sub>为N维列向量，在样本空间定义各类样本均值向量记为m<sub>i</sub>，<img file="FDA00003535409100014.GIF" wi="52" he="60" />为所有样本均值，T表示矩阵转置；E、使用以下公式求得矩阵<img file="FDA00003535409100015.GIF" wi="165" he="85" />最大特征值λ对应的模为1的特征向量ω：<maths num="0003"><![CDATA[<math><mrow><msubsup><mi>S</mi><mi>fw</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>S</mi><mi>fb</mi></msub><mi>ω</mi><mo>=</mo><mi>λω</mi></mrow></math>]]></maths>该公式为求一般矩阵<img file="FDA00003535409100017.GIF" wi="136" he="88" />的特征值问题，其中λ取该矩阵的最大特征值，而ω为λ对应的特征向量；F、使用以下公式分别计算新的m<sub>i</sub>和μ<sub>ij</sub>：<maths num="0004"><![CDATA[<math><mrow><msub><mi>m</mi><mi>i</mi></msub><mo>=</mo><mfrac><mrow><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>u</mi><mi>ij</mi><mi>m</mi></msubsup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><mo>)</mo></mrow></mrow></mfrac></mrow></math>]]></maths>其中m<sub>i</sub>是局部解，<maths num="0005"><![CDATA[<math><mrow><msub><mi>u</mi><mi>ij</mi></msub><mo>=</mo><mfrac><msup><mrow><mo>(</mo><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi><mo>-</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></mrow></msup><mrow><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>c</mi></munderover><msup><mrow><mo>(</mo><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>k</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi><mo>-</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>k</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>k</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi><mo>)</mo></mrow><mrow><mo>-</mo><mfrac><mn>1</mn><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></mrow></msup></mrow></mfrac></mrow></math>]]></maths>其中k为变量且取值区间分别为：[1，c]，在模糊聚类中，通常限定u<sub>ij</sub>∈[0,1]，因此对上式给出如下限定条件，若：<maths num="0006"><![CDATA[<math><mrow><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>m</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi><mo>≤</mo><mfrac><mn>1</mn><mi>λ</mi></mfrac><msup><mi>ω</mi><mi>T</mi></msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>m</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>T</mi></msup><mi>ω</mi></mrow></math>]]></maths>则：u<sub>ij</sub>=1且对所有i′≠i，有u<sub>i′j</sub>=0；G、使用以下公式计算J<sub>FFC</sub>并将迭代次数自增1：<maths num="0007"><![CDATA[<math><mrow><msub><mi>J</mi><mi>FFC</mi></msub><mo>=</mo><mfrac><mrow><msup><mi>ω</mi><mi>T</mi></msup><msub><mi>S</mi><mi>fb</mi></msub><mi>ω</mi></mrow><mrow><msup><mi>ω</mi><mi>T</mi></msup><msub><mi>S</mi><mi>fw</mi></msub><mi>ω</mi></mrow></mfrac></mrow></math>]]></maths>其中J<sub>FFC</sub>为模糊Fisher准则(Fuzzy Fisher Criterion)函数；H、按照预先设定的条件进行判断，如预先设定的条件得到满足，则转到步骤I，否则返回步骤D；I、使用以下公式计算各特征的重要性度量f<sub>k</sub>，并将特征按照f<sub>k</sub>降序排列：<maths num="0008"><![CDATA[<math><mrow><msub><mi>f</mi><mi>k</mi></msub><mo>=</mo><mfrac><mrow><mo>\|</mo><msub><mi>ω</mi><mi>k</mi></msub><mo>\|</mo></mrow><mrow><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>d</mi></munderover><mo>\|</mo><msub><mi>ω</mi><mi>k</mi></msub><mo>\|</mo></mrow></mfrac></mrow></math>]]></maths>其中定义f<sub>k</sub>为第k个特征重要性度量，设ω=(ω<sub>1</sub>,ω<sub>2</sub>,…ω<sub>d</sub>)′；J、在降序排列的特征中寻找前d<sub>θ</sub>个特征作为降维后特征，使得<img file="FDA00003535409100025.GIF" wi="174" he="126" />且d<sub>θ</sub>最小，从而实现降维，算法结束。
地址	223003 江苏省淮安市高教园区枚乘东路1号

您可能感兴趣的专利

FUNCTIONAL USE-CASE GENERATION

Sitagliptin tannate complex

Enhanced data interface for contactless communications

Method for making bismuth-containing liquid pharmaceutical suspensions

一种交联电缆保护带自动切断机

可离子交换玻璃基材的激光切割

高灵敏漏保插头

锅炉用管板的打磨装置

微波处理装置

一种在存取款一体机的纸币堆叠装置中使用的纸币运输机构

一种壳聚糖乙酰水杨酸盐的制备方法及其应用

单板多用途电子秤

一种稀酸罐呼吸阀

多用途双阶电子秤

一种两用电子秤

一种洗衣机内筒及其制作材料和制作方法

一种房车燃气罐固定架

镀膜玻片在超分辨显微技术上的应用