发明名称 | 一种基于多参数干扰的隐私保护关联规则数据挖掘方法 | ||
摘要 | 本发明涉及一种基于多参数干扰的隐私保护关联规则数据挖掘方法,包括:将原始数据集构造为二维布尔矩阵D,利用数据干扰和查询限制策略对布尔矩阵D进行随机干扰以提高隐私保护度,得到干扰后数据集D′;采用改进后的MASK算法对干扰后数据集D′进行项集支持度重构,并通过集合原理优化计数过程,获取频繁项集,得到关联规则。与现有技术相比,本发明实现了数据干扰策略和查询限制策略的相互结合,克服了两个策略本身存在的缺陷,提高了隐私保护程度;根据矩阵分块思想发现了概率逆矩阵之间的递推关系,避免了先求出概率矩阵再计算其逆矩阵的繁琐过程,基于集合原理优化计数过程,消除了计数过程中的指数级时间复杂度,很大地提高了方法执行效率。 | ||
申请公布号 | CN103605749A | 申请公布日期 | 2014.02.26 |
申请号 | CN201310591116.2 | 申请日期 | 2013.11.20 |
申请人 | 同济大学 | 发明人 | 马云龙;刘敏;楼灏亮;章锋;魏晓婷 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 上海科盛知识产权代理有限公司 31225 | 代理人 | 王小荣 |
主权项 | 一种基于多参数干扰的隐私保护关联规则数据挖掘方法,其特征在于,包括以下步骤:(1)将原始数据集构造为二维布尔矩阵D,利用数据干扰和查询限制策略对布尔矩阵D进行随机干扰以提高隐私保护度,得到干扰后数据集D′;(2)采用改进后的MASK算法对干扰后数据集D′进行项集支持度重构,并通过集合原理优化计数过程,获取频繁项集,得到关联规则数据。 | ||
地址 | 200092 上海市杨浦区四平路1239号 |