发明名称 |
一种基于领域知识的多层关联规则挖掘方法及系统 |
摘要 |
本发明属于数据挖掘技术领域,本发明具体公开了一种基于领域知识的多层关联规则挖掘方法及系统,该方法包括以下步骤:以领域知识作为基础数据,根据该基础数据的相关性构建领域相关性模型;以领域知识作为基础数据,根据该基础数据构建结构分类层;在所述结构分类层基础上对项进行聚类存储,从而产生项的聚类层以及构建原始事务数据库;对所述原始事务数据库进行层次分类,并将此层次分类映射到频繁模式树中构建频繁模式树结构;对频繁模式树进行搜索得到频繁项集的结果。本发明不仅可以确保频繁项集挖掘结果的正确性和完整性,而且还比现有同类最新挖掘算法具有更好的执行效率和扩展性。 |
申请公布号 |
CN104281617A |
申请公布日期 |
2015.01.14 |
申请号 |
CN201310290018.5 |
申请日期 |
2013.07.10 |
申请人 |
广州中国科学院先进技术研究所 |
发明人 |
孟振宇;吴晓鸰;王慰;李建军 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州新诺专利商标事务所有限公司 44100 |
代理人 |
肖云 |
主权项 |
一种基于领域知识的多层关联规则挖掘方法,其特征在于包括以下步骤:以领域知识作为基础数据,根据该基础数据的相关性构建领域相关性模型;以领域知识作为基础数据,根据该基础数据构建结构分类层;在所述结构分类层基础上对项进行聚类存储,从而产生项的聚类层以及构建原始事务数据库;对所述原始事务数据库进行层次分类,并将此层次分类映射到频繁模式树中构建频繁模式树结构;对频繁模式树进行搜索得到频繁项集的结果。 |
地址 |
511458 广东省广州市南沙区海滨路1121号A栋401 |