发明名称 |
一种关联规则挖掘方法及其系统 |
摘要 |
本发明公开了一种关联规则挖掘方法及其系统。本发明方法包括:由频繁K项集生成K+1项集;执行多个并行的处理任务,其中,每个处理任务获取事务数据集中相应部分的数据,并统计K+1项集在该部分数据中的频繁计数值;对所有处理任务的统计结果进行汇总得到K+1项集在所述事务数据集中的频繁计数值,根据K+1项集的频繁计数值生成满足支持度要求的频繁K+1项集,并根据所述频繁K+1项集在判断有满足可信度要求的关联规则时输出该关联规则。采用本发明,可提高关联规则挖掘的处理效率。 |
申请公布号 |
CN101799810A |
申请公布日期 |
2010.08.11 |
申请号 |
CN200910077996.5 |
申请日期 |
2009.02.06 |
申请人 |
中国移动通信集团公司 |
发明人 |
高丹;邓超;徐萌;罗治国;周文辉;何清;曾立;郑诗豪;沈亚飞;陈磊 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
魏杉 |
主权项 |
一种关联规则挖掘方法,其特征在于,包括:由频繁K项集生成K+1项集;执行多个并行的处理任务,其中,每个处理任务获取事务数据集中相应部分的数据,并统计K+1项集在该部分数据中的频繁计数值;对所有处理任务的统计结果进行汇总得到K+1项集在所述事务数据集中的频繁计数值,根据K+1项集的频繁计数值生成满足支持度要求的频繁K+1项集,并根据所述频繁K+1项集在判断有满足可信度要求的关联规则时输出该关联规则。 |
地址 |
100032 北京市西城区金融大街29号 |