发明名称 一种数据库近似字典规则的挖掘方法、系统及数据库终端
摘要 本发明适用于近似字典规则挖掘领域,提供了一种数据库近似字典规则的挖掘方法、系统及数据库终端,所述近似字典依赖规则挖掘方法包括如下步骤:对数据库r进行扫描分析,剔除单一值列和所有值都唯一的列,其余候选列集记为R;统计所述候选列集R各列中各项的支持度,并对支持度大于给定最小支持度的项用整数编码;将所述数据库r的每一行事务按顺序编号,并以列表记录所述各项包含的行事务编号,再缓存;使用LCfd的方法挖掘数据库r的近似字典规则;输出所述近似字典规则。在本发明中,通过在数据库中运用LCfd的近似字典规则挖掘方法,采用逆序递增的搜索策略,并通过修剪方法对搜索树进行剪枝,同时缓存已经发现的规则,可减少整个挖掘方法的计算量,自动、高效地找出数据库中的近似字典规则。
申请公布号 CN103353864A 申请公布日期 2013.10.16
申请号 CN201210471801.7 申请日期 2012.11.20
申请人 深圳市华傲数据技术有限公司 发明人 王明兴;贾西贝
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种数据库近似字典规则的挖掘方法,其特征在于,所述方法包括如下步骤: 步骤S1:对数据库r进行扫描分析,剔除单一值列和所有值都唯一的列,其余候选列集记为R; 步骤S2:统计所述候选列集R各列中各项的支持度,并对支持度大于给定最小支持度的项用整数编码; 步骤S3:将所述数据库r的每一行事务按顺序编号,并以列表记录所述各项包含的行事务编号,再缓存; 步骤S4:使用LCfd的方法挖掘数据库r的近似字典规则; 步骤S5:输出所述近似字典规则。
地址 518057 广东省深圳市高新区中区高新中一道9号软件大厦7楼713室