发明名称 一种挖掘时序数据状态关联的方法
摘要 一种挖掘时序数据状态关联的方法,首先对时序数据变量进行预处理,包括去野值、等间隔插值、归一化操作;然后对单个变量进行状态挖掘,用动态划分聚类方法对单个变量所有窗口的综合特征向量进行聚类,不同簇的窗口代表不同的状态,将所有簇按照大小排序,将每个窗口用其所在簇对应的字符表示,这样原始数值型数据被转化成字符串形式,即获取每个变量的状态字符串;再将所有变量的状态字符串对齐,获得多变量状态矩阵;利用Apriori算法挖掘不同变量状态之间的关联规则并给出形式化表达及其关联强度;最后进行关联规则约简以去除冗余信息;本发明具有抗噪音干扰能力,适合于对小参数集合细致地分析其状态取值关联性,挖掘出状态值映射关系。
申请公布号 CN106384128A 申请公布日期 2017.02.08
申请号 CN201610814387.3 申请日期 2016.09.09
申请人 西安交通大学;中国西安卫星测控中心 发明人 王文青;王徐华;杨天社;鲍军鹏;赵静;李辉;张海龙;齐勇
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 西安智大知识产权代理事务所 61215 代理人 张震国
主权项 一种挖掘时序数据状态关联的方法,其特征在于,实现该方法的系统包括数据预处理模块(1‑1)、特征提取模块(1‑2)、动态划分聚类模块(1‑3)、多变量状态矩阵生成模块(1‑4)、Apriori状态关联挖掘模块(1‑5)和关联规则约简模块(1‑6),其具体步骤是:1)首先,数据预处理模块(1‑1)对原始时序数据进行去野值、等间隔插值、归一化操作,得到有效数据形式;2)其次,特征提取模块(1‑2)将时间序列变量的有效数据划分成长度相等的窗口,对每个窗口数据提取特征,包括傅里叶特征、统计特征、小波特征构成特征向量;3)然后,动态划分聚类模块(1‑3)对单个变量所有窗口的特征向量进行动态划分聚类,将聚类得到的簇按照大小排序,最大的簇用字符‘a’表示,次大的簇用‘b’表示,依次类推,小于给定阈值2的簇则视为噪声,用‘?’表示,将每个窗口用其所在簇对应的字符表示,这样原始数值型数据被转化成字符串形式,即该变量的状态字符串;4)多变量状态矩阵生成模块(1‑4)将所有变量的状态字符串按照时间对齐,形成状态矩阵;5)Apriori状态关联挖掘模块(1‑5)用Apriori算法对多变量状态矩阵进行频繁项集和关联规则挖掘;6)最后,关联规则约简模块(1‑6)对检测到的关联规则进行约简,消除冗余信息,得到最终的多变量状态关联规则。
地址 710049 陕西省西安市碑林区咸宁西路28号