发明名称 基于滑动窗口的数据流关联规则挖掘方法
摘要 本发明公开了一种基于滑动窗口的数据流关联规则挖掘方法。利用流数据库管理系统的输入输出机制,将应用产生的原始数据流接入流数据库管理系统。在流数据库管理系统中建立数据流预处理应用环境,并将处理后的输出数据流传递给关联规则挖掘系统。使用关联规则挖掘系统时,用户通过设置滑动窗口大小、步长,关联规则的最小支持度、置信度及其相应的误差值确定关联规则查询条件。关联规则挖掘系统将产生的关联规则实时输出给外部设备。利用数据流上关联规则挖掘的现有研究及实现成果,提出基于滑动窗口的数据流关联规则方法,在已有的流数据库管理系统上,使用者可以根据应用需求选择合适的查询参数,获得最好的性能。
申请公布号 CN101667197A 申请公布日期 2010.03.10
申请号 CN200910152876.7 申请日期 2009.09.18
申请人 浙江大学 发明人 寿黎但;胡天磊;陈珂;陈刚;严澄
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州求是专利事务所有限公司 代理人 林怀禹
主权项 1、一种基于滑动窗口的数据流关联规则挖掘方法,其特征在于,该方法的步骤如下:1)根据应用对数据流的实时性、可靠性以及吞吐率的要求,选择一个满足数据流预处理的流数据库管理系统;2)开发一个数据流关联规则挖掘系统实现与上述步骤1)中选取的流数据库管理系统的交互;3)分析应用主题域,根据要进行关联规则挖掘的原始数据项特征,确定数据抽象和归一化的预处理方法,部署在步骤1)选定的流数据库管理系统;4)根据应用对关联规则挖掘的需求,确定滑动窗口和滑动步长的大小,确定关联规则挖掘的最小支持度和置信度以及相应允许的误差值;5)数据流关联规则挖掘系统根据可视化配置参数对最近一段时间内的数据流进行关联规则挖掘,并实时输出挖掘得到的关联规则。
地址 310027浙江省杭州市西湖区浙大路38号