主权项 |
一种基于时间序列的计算机数据挖掘方法,其特征在于,该方法包括以下步骤:步骤1:输入给定样本集x,其中x={x<sub>1</sub>,x<sub>2</sub>,···,x<sub>n</sub>};步骤2:输入需选择的特征数m;步骤3:对输入样本集进行去噪、归一化处理;步骤4:对处理后的样本集进行相似矩阵M的构造,其相似矩阵M表示为:<img file="1.GIF" wi="494" he="146" />其中x<sub>i</sub>,x<sub>j</sub>为给定样本,M为相似矩阵,M<sub>0</sub>为单位矩阵,<img file="FDA0000894430490000012.GIF" wi="222" he="79" />为样本x<sub>i</sub>和x<sub>j</sub>之间的马氏距离;步骤5:计算得到相似图的非规格拉普拉斯矩阵S,其非规格拉普拉斯矩阵S表示为:S=D‑M,其中S为非规格拉普拉斯矩阵,M为相似矩阵,D为对角矩阵,对角矩阵D的求取采用D<sub>ii</sub>=Σ<sub>j</sub>M<sub>ij</sub>进行求取;步骤6:采用拉普拉斯特征映射算法得到特征向量空间Y,其特征向量空间Y表示为:Y=[Y<sub>1</sub>,Y<sub>2</sub>,...,Y<sub>k</sub>],其中,k为大于m小于n的常数;步骤7:采用多簇特征选择得分,选出m个相关系数最大的属性,其中多簇特征选择得分的定义为:F(j)=a<sub>j</sub>{Y→X},其中,a<sub>j</sub>为特征向量空间Y中第j个特征逼近其原始数据X中对应数值的相关系数,F(j)为第j个特征的权重得分数,j为从1到k的常数;步骤8:输出m个需选择的特征数W,其特征数W表示为:W=[W<sub>1</sub>,W<sub>2</sub>,...,W<sub>m</sub>]。 |