一种大规模数据的关联规则挖掘方法,申请号CN201210562345.7-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种大规模数据的关联规则挖掘方法
摘要	本发明提供一种大规模数据的关联规则挖掘方法，包括以下步骤：1）对输入数据进行基于相似度的分类预处理，使得同一分类中的记录间具有高相似度；2）对每个分类中的数据进行基于Apriori算法的挖掘，得到各分类的频繁项集；3）合并所有分类的频繁项集，将大于最小置信度的频繁项集对应关联规则判定为强关联规则。本发明能够减少产生不必要的关联性小的候选项集，从而提高整体数据的关联规则挖掘效率，具有更好的扩展性。
申请公布号	CN103020256B	申请公布日期	2016.04.20
申请号	CN201210562345.7	申请日期	2012.12.21
申请人	电子科技大学	发明人	罗光春;田玲;秦科;陈爱国;段贵多
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	电子科技大学专利中心 51203	代理人	李明光
主权项	一种大规模数据的关联规则挖掘方法，其特征在于，包括以下步骤：1)对输入数据进行基于相似度的分类预处理，使得同一分类中的记录间具有高相似度；2)对每个分类中的数据进行基于Apriori算法的挖掘，得到各分类的频繁项集；3)合并所有分类的频繁项集，将大于最小信赖度的频繁项集对应关联规则判定为强关联规则；分类预处理的具体方法是：1.1在输入数据中选择k个条记录作为分类的基准点；k为大于等于2的整数；1.2扫描数据，并求出每一条记录与各基准点的相似度，根据将每条记录分配至与其相似度最高的基准点所对应的分类上；扫描完全部数据后，形成各分类对应区域；与一条记录相似度最高的基准点有1个或1个以上；1.3分别对各分类对应区域的记录进行平均，利用平均后的结果确定新的该区域的新的基准点，判断区域的基准点是否变化，如是，跳转到步骤1.2，如否，分类结束。
地址	611731 四川省成都市高新区（西区）西源大道2006号

您可能感兴趣的专利

PRODUCTION OF TERPENES

PRODUCTION OF CERAMIC PLATE WITH PULP SLUDGE

DIELECTRIC PORCELAIN COMPOSITION

PRODUCTION OF LEAD-CONTAINING COMPLEX PEROVSKITE CERAMICS

METHOD FOR DETECTING REGISTER OF COLOR PRINTER

FILM ALIGNING DEVICE AND ALIGNING METHOD USING IT

MUSHROOMS JUICE AND PRODUCTION THEREOF

CLEANING METHOD

PICKLED GELIDIUM JELLY AND SIMILAR FOOD THEREOF

DATA SAVING/RESTORING SYSTEM

FORMATION OF THIN FILM ON FIBER END SURFACE

MULTIPLICATION CIRCUIT

DRIVING METHOD FOR RECIPROCATING LINEAR SOLENOID

SOLAR CELL ELEMENT

COMPOSITE INPUT INVERTER DEVICE