发明名称 一种基于拉普拉斯正则化无监督的聚类特征选取方法
摘要 本发明公开了一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括:(1)构建样本特征矩阵;(2)计算拉普拉斯矩阵;(3)对样本特征矩阵进行特征提取。本发明通过直接度量后续学预测结果的方差来选择特征,能直接提高后续学预测效果;同时在特征提取过程中考虑选取的特征点对于学问题的预测值的影响,故能有效提高后续的学效率;另外本发明数据的建模是基于数据的流形几何的拉普拉斯方法,该方法能有效的反映数据在空间中的分布信息,从而能够找出信息量最大的维度。
申请公布号 CN102722578A 申请公布日期 2012.10.10
申请号 CN201210182514.4 申请日期 2012.05.31
申请人 浙江大学 发明人 何晓飞;姚冠红
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州天勤知识产权代理有限公司 33224 代理人 胡红娟
主权项 一种基于拉普拉斯正则化无监督的聚类特征选取方法,包括如下步骤:(1)获取样本数据集合,进而构建样本数据集合的样本特征矩阵;所述的样本特征矩阵为n×m维矩阵,n为特征个数,m为样本个数,且m和n均为大于1的自然数;(2)根据所述的样本特征矩阵,计算出其对应的拉普拉斯矩阵;(3)根据所述的拉普拉斯矩阵,利用基于拉普拉斯正则化算法从样本特征矩阵中提取出k行特征集合,k为预期给定的特征提取个数。
地址 310027 浙江省杭州市西湖区浙大路38号