发明名称 基于递增投影规则的广义无冗余序列规则挖掘方法
摘要 本发明公开了一种基于递增投影规则的广义无冗余序列规则挖掘方法,用于解决现有序列规则挖掘方法生成序列规则效率低的技术问题。技术方案是包括冗余性检查和递增投影产生规则两部分,通过多规则的关联关系,将频繁闭序列和序列生成子的检查精简到重叠集的检查,通过递增消除冗余的方法经行规则投影,从而提升了时间及空间效率。该方法在保障规则完备性的前提下,得到了更为精简的序列规则,提高了生成序列规则的效率。
申请公布号 CN104915683A 申请公布日期 2015.09.16
申请号 CN201510312885.3 申请日期 2015.06.09
申请人 西北工业大学 发明人 尤涛;杜承烈;吴其蔓;钟冬;成驰
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 西北工业大学专利中心 61204 代理人 王鲜凯
主权项 一种基于递增投影规则的广义无冗余序列规则挖掘方法,其特征在于包括以下步骤:第一部分、冗余性检查的步骤如下:步骤一、遍历搜索找出闭序列集和生成子集的相同序列构成的重叠集,并删除重叠集中的相同元素;对于输入的频繁闭序列ee及其生成子集合ge,扫描得到生成子和闭序列的重叠项是:AB、ABC和ABCD;步骤二、找出重叠集在闭序列集合生成子集的投影和被投影序列,即找出生成子集中能被重叠集元素投影的序列集合,并找出闭序列集中能被重叠集中元素投影的序列集合;得到重叠集公共集合ge’,元素包括AB、ABC和ABCD;扫描频繁闭序列集合ee,以及生成子集合ge,得到能投影元素集合g2:A;能被投影的元素集合g1:ABCDE;步骤三、对重叠集的所有序列进行冗余迹检查,遍历重叠集中元素,将不满足冗余迹检查的元素删除;对于重叠集进行冗余性迹检查后得到重叠集元素AB、ABC和ABCD;第二部分、递增投影产生规则的步骤如下:步骤一、得到冗余性迹检查后的频繁闭序列及其生成子的重叠集,以及频繁闭序列中可被重叠集元素投影的投影集合,以及重叠集中可被生成子投影的被投影集合;得到重叠集元素包括AB、ABC和ABCD;g1集合:ABCDE;g2集合:A;步骤二、将重叠集中的元素按照字典序排列;按照字典序排列得到AB、ABC和ABCD;步骤三、按照字典序对重叠集中元素依次进行投影;AB、ABC投影得到AB—>C;AB、ABCD投影得到AB—>CD;ABC、ABCD投影得到ABC—>D;最终r1集得到满足置信度阈值的如下序列规则:ABC—>D;AB—>C;AB—>CD;步骤四、将重叠集元素投影到投影集中得到无冗余序列规则,并将被投影集中元素投影到重叠集中得到无冗余序列规则;对于无冗余规则集合r3:A、AB投影得到A—>B;A、ABC投影得到A—>BC;A、ABCD投影得到A—>BCD;对于无冗余规则集合r2:AB、ABCDE投影得到AB—>CDE;ABC、ABCDE投影得到ABC—>DE;ABCD、ABCDE投影得到ABCD—>E;最终得到所有的无冗余序列规则集合为r1、r2、r3之和,包括ABC—>D;AB—>C;AB—>CD;A—>B;A—>BC;A—>BCD;AB—>CDE;ABC—>DE;ABCD—>E。
地址 710072 陕西省西安市友谊西路127号