一种基于拉普拉斯正则化无监督的聚类特征选取方法,申请号CN201210182514.4-传众专利搜索

发明名称	一种基于拉普拉斯正则化无监督的聚类特征选取方法
摘要	本发明公开了一种基于拉普拉斯正则化无监督的聚类特征选取方法，包括：（1）构建样本特征矩阵；（2）计算拉普拉斯矩阵；（3）对样本特征矩阵进行特征提取。本发明通过直接度量后续学预测结果的方差来选择特征，能直接提高后续学预测效果；同时在特征提取过程中考虑选取的特征点对于学问题的预测值的影响，故能有效提高后续的学效率；另外本发明数据的建模是基于数据的流形几何的拉普拉斯方法，该方法能有效的反映数据在空间中的分布信息，从而能够找出信息量最大的维度。
申请公布号	CN102722578B	申请公布日期	2014.07.02
申请号	CN201210182514.4	申请日期	2012.05.31
申请人	浙江大学	发明人	何晓飞;姚冠红
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	杭州天勤知识产权代理有限公司 33224	代理人	胡红娟
主权项	1.一种基于拉普拉斯正则化无监督的聚类特征选取方法，包括如下步骤：（1）获取样本数据集合，进而构建样本数据集合的样本特征矩阵；所述的样本特征矩阵为n×m维矩阵，n为特征个数，m为样本个数，且m和n均为大于1的自然数；（2）根据所述的样本特征矩阵，计算出其对应的拉普拉斯矩阵；（3）根据所述的拉普拉斯矩阵，利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合，具体过程如下： a.取样本特征矩阵中的任一行特征集合作为特征过渡矩阵Y<sub>1</sub>； b.根据以下方程组计算特征过渡矩阵Y<sub>1</sub>对应的方差z<sub>1</sub>： z<sub>1</sub>=max{g<sub>11</sub>,g<sub>12</sub>,g<sub>13</sub>…g<sub>1m</sub>} g<sub>1j</sub>=(y<sub>1j</sub>)<sup>T</sup>H<sup>-1</sup>Y<sub>1</sub>(Y<sub>1</sub>)<sup>T</sup>H<sup>-1</sup>y<sub>1j</sub><img file="FDA0000449479110000011.GIF" wi="721" he="157" />Q<sub>1</sub>=M+(Y<sub>1</sub>)<sup>T</sup>Y<sub>1</sub>M=β(I+αL)<sup>-1</sup>其中：y<sub>1j</sub>为Y<sub>1</sub>的第j列特征向量，j为自然数，且1≤j≤m，L为样本特征矩阵对应的拉普拉斯矩阵，I为单位矩阵，α和β均为给定的运算系数； c.根据步骤a和b，遍历样本特征矩阵中的每一行特征集合，得到n个方差，从样本特征矩阵中提取出最小方差所对应的一行特征集合，并令该行特征集合为S<sub>1</sub>，以完成第一次特征提取； d.依次完成k次特征提取后从样本特征矩阵中提取得到k行特征集合，k为预期给定的特征提取个数；其中，关于第i次特征提取的过程为：构建一i×m维矩阵，令S<sub>1</sub>～S<sub>i-1</sub>为该矩阵的前i-1行特征集合，取样本特征矩阵中除S<sub>1</sub>～S<sub>i-1</sub>外的任一行特征集合为该矩阵的第i行特征集合，并使该矩阵作为特征过渡矩阵Y<sub>i</sub>，i为自然数，且2≤i≤k；根据以下方程组计算特征过渡矩阵Y<sub>i</sub>对应的方差z<sub>i</sub>： z<sub>i</sub>=max{g<sub>i1</sub>,g<sub>i2</sub>,g<sub>i3</sub>…g<sub>im</sub>} g<sub>ij</sub>=(y<sub>ij</sub>)<sup>T</sup>H<sup>-1</sup>Y<sub>i</sub>(Y<sub>i</sub>)<sup>T</sup>H<sup>-1</sup>y<sub>ij</sub><img file="FDA0000449479110000021.GIF" wi="693" he="157" />Q<sub>i</sub>=M+(Y<sub>i</sub>)<sup>T</sup>Y<sub>i</sub>M=β(I+αL)<sup>-1</sup>其中：y<sub>ij</sub>为Y<sub>i</sub>的第j列特征向量；依此，遍历样本特征矩阵中除S<sub>1</sub>～S<sub>i-1</sub>外的每一行特征集合，得到n-i+1个方差，从样本特征矩阵中提取出最小方差所对应的一行特征集合，并令该行特征集合为S<sub>i</sub>。
地址	310027 浙江省杭州市西湖区浙大路38号