发明名称 一种基于多参数干扰的隐私保护关联规则数据挖掘方法
摘要 本发明涉及一种基于多参数干扰的隐私保护关联规则数据挖掘方法,包括:将原始数据集构造为二维布尔矩阵D,利用数据干扰和查询限制策略对布尔矩阵D进行随机干扰以提高隐私保护度,得到干扰后数据集D′;采用改进后的MASK算法对干扰后数据集D′进行项集支持度重构,并通过集合原理优化计数过程,获取频繁项集,得到关联规则。与现有技术相比,本发明实现了数据干扰策略和查询限制策略的相互结合,克服了两个策略本身存在的缺陷,提高了隐私保护程度;根据矩阵分块思想发现了概率逆矩阵之间的递推关系,避免了先求出概率矩阵再计算其逆矩阵的繁琐过程,基于集合原理优化计数过程,消除了计数过程中的指数级时间复杂度,很大地提高了方法执行效率。
申请公布号 CN103605749A 申请公布日期 2014.02.26
申请号 CN201310591116.2 申请日期 2013.11.20
申请人 同济大学 发明人 马云龙;刘敏;楼灏亮;章锋;魏晓婷
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海科盛知识产权代理有限公司 31225 代理人 王小荣
主权项 一种基于多参数干扰的隐私保护关联规则数据挖掘方法,其特征在于,包括以下步骤:(1)将原始数据集构造为二维布尔矩阵D,利用数据干扰和查询限制策略对布尔矩阵D进行随机干扰以提高隐私保护度,得到干扰后数据集D′;(2)采用改进后的MASK算法对干扰后数据集D′进行项集支持度重构,并通过集合原理优化计数过程,获取频繁项集,得到关联规则数据。
地址 200092 上海市杨浦区四平路1239号