主权项 |
1.一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括如下步骤: (1)获取样本数据集合,进而构建样本数据集合的样本特征矩阵; 所述的样本特征矩阵为n×m维矩阵,n为特征个数,m为样本个数,且m和n均为大于1的自然数; (2)根据所述的样本特征矩阵,计算出其对应的拉普拉斯矩阵; (3)根据所述的拉普拉斯矩阵,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合,具体过程如下: a.取样本特征矩阵中的任一行特征集合作为特征过渡矩阵Y<sub>1</sub>; b.根据以下方程组计算特征过渡矩阵Y<sub>1</sub>对应的方差z<sub>1</sub>: z<sub>1</sub>=max{g<sub>11</sub>,g<sub>12</sub>,g<sub>13</sub>…g<sub>1m</sub>} g<sub>1j</sub>=(y<sub>1j</sub>)<sup>T</sup>H<sup>-1</sup>Y<sub>1</sub>(Y<sub>1</sub>)<sup>T</sup>H<sup>-1</sup>y<sub>1j</sub><img file="FDA0000449479110000011.GIF" wi="721" he="157" />Q<sub>1</sub>=M+(Y<sub>1</sub>)<sup>T</sup>Y<sub>1</sub>M=β(I+αL)<sup>-1</sup>其中:y<sub>1j</sub>为Y<sub>1</sub>的第j列特征向量,j为自然数,且1≤j≤m,L为样本特征矩阵对应的拉普拉斯矩阵,I为单位矩阵,α和β均为给定的运算系数; c.根据步骤a和b,遍历样本特征矩阵中的每一行特征集合,得到n个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为S<sub>1</sub>,以完成第一次特征提取; d.依次完成k次特征提取后从样本特征矩阵中提取得到k行特征集合,k为预期给定的特征提取个数; 其中,关于第i次特征提取的过程为:构建一i×m维矩阵,令S<sub>1</sub>~S<sub>i-1</sub>为该矩阵的前i-1行特征集合,取样本特征矩阵中除S<sub>1</sub>~S<sub>i-1</sub>外的任一行特征集合为该矩阵的第i行特征集合,并使该矩阵作为特征过渡矩阵Y<sub>i</sub>,i为自然数,且2≤i≤k;根据以下方程组计算特征过渡矩阵Y<sub>i</sub>对应的方差z<sub>i</sub>: z<sub>i</sub>=max{g<sub>i1</sub>,g<sub>i2</sub>,g<sub>i3</sub>…g<sub>im</sub>} g<sub>ij</sub>=(y<sub>ij</sub>)<sup>T</sup>H<sup>-1</sup>Y<sub>i</sub>(Y<sub>i</sub>)<sup>T</sup>H<sup>-1</sup>y<sub>ij</sub><img file="FDA0000449479110000021.GIF" wi="693" he="157" />Q<sub>i</sub>=M+(Y<sub>i</sub>)<sup>T</sup>Y<sub>i</sub>M=β(I+αL)<sup>-1</sup>其中:y<sub>ij</sub>为Y<sub>i</sub>的第j列特征向量; 依此,遍历样本特征矩阵中除S<sub>1</sub>~S<sub>i-1</sub>外的每一行特征集合,得到n-i+1个方差,从样本特征矩阵中提取出最小方差所对应的一行特征集合,并令该行特征集合为S<sub>i</sub>。 |