发明名称 一种基于时间序列的计算机数据挖掘方法
摘要 本发明公开了一种基于时间序列的计算机数据挖掘方法,该计算机数据挖掘方法通过对输入样本集进行去噪、归一化处理,并对处理后的样本集进行相似矩阵构造,得到相似图的非规格拉普拉斯矩阵,再采用拉普拉斯特征映射算法得到特征向量空间,然后采用多簇特征选择得分选出相关系数最大的属性,最后输出需选择的特征数。该方法能够有效地处理数据量大、维度高的时间序列数据,能够高度还原原始数据和降维处理,化简了运算与处理,提高了数据挖掘的精度,便于高效地获取所需特征数据。
申请公布号 CN105653672A 申请公布日期 2016.06.08
申请号 CN201511017621.1 申请日期 2015.12.29
申请人 郑州轻工业学院 发明人 黄海洋;关宏波
分类号 G06F17/30(2006.01)I;G06K9/62(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 郑州优盾知识产权代理有限公司 41125 代理人 孙诗雨
主权项 一种基于时间序列的计算机数据挖掘方法,其特征在于,该方法包括以下步骤:步骤1:输入给定样本集x,其中x={x<sub>1</sub>,x<sub>2</sub>,···,x<sub>n</sub>};步骤2:输入需选择的特征数m;步骤3:对输入样本集进行去噪、归一化处理;步骤4:对处理后的样本集进行相似矩阵M的构造,其相似矩阵M表示为:<img file="1.GIF" wi="494" he="146" />其中x<sub>i</sub>,x<sub>j</sub>为给定样本,M为相似矩阵,M<sub>0</sub>为单位矩阵,<img file="FDA0000894430490000012.GIF" wi="222" he="79" />为样本x<sub>i</sub>和x<sub>j</sub>之间的马氏距离;步骤5:计算得到相似图的非规格拉普拉斯矩阵S,其非规格拉普拉斯矩阵S表示为:S=D‑M,其中S为非规格拉普拉斯矩阵,M为相似矩阵,D为对角矩阵,对角矩阵D的求取采用D<sub>ii</sub>=Σ<sub>j</sub>M<sub>ij</sub>进行求取;步骤6:采用拉普拉斯特征映射算法得到特征向量空间Y,其特征向量空间Y表示为:Y=[Y<sub>1</sub>,Y<sub>2</sub>,...,Y<sub>k</sub>],其中,k为大于m小于n的常数;步骤7:采用多簇特征选择得分,选出m个相关系数最大的属性,其中多簇特征选择得分的定义为:F(j)=a<sub>j</sub>{Y→X},其中,a<sub>j</sub>为特征向量空间Y中第j个特征逼近其原始数据X中对应数值的相关系数,F(j)为第j个特征的权重得分数,j为从1到k的常数;步骤8:输出m个需选择的特征数W,其特征数W表示为:W=[W<sub>1</sub>,W<sub>2</sub>,...,W<sub>m</sub>]。
地址 450002 河南省郑州市金水区东风路5号