发明名称 |
频繁项集挖掘方法 |
摘要 |
本发明涉及数据挖掘及数据隐私技术领域,公开了一种频繁项集挖掘方法,包括:S1:将原始数据库中事务长度大于限制长度的事务分割成多个子事务,使得分割后数据库中每条事务的长度不大于所述限制长度;S2:根据预先指定的支持度阈值,在分割后的数据库中利用支持度估计法和动态下降法挖掘频繁项集。本发明能够在满足差分隐私保护的同时提供更高的挖掘效率和挖掘结果可用性。 |
申请公布号 |
CN105740245A |
申请公布日期 |
2016.07.06 |
申请号 |
CN201410746488.2 |
申请日期 |
2014.12.08 |
申请人 |
北京邮电大学 |
发明人 |
程祥;苏森;许胜之;徐鹏;双锴;王玉龙;张忠宝 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种频繁项集挖掘方法,其特征在于,包括:S1:将原始数据库中事务长度大于限制长度的事务分割成多个子事务,使得分割后数据库中每条事务的长度不大于所述限制长度;S2:根据预先指定的支持度阈值,在分割后的数据库中利用支持度估计法和动态下降法挖掘频繁项集。 |
地址 |
100876 北京市海淀区西土城路10号北京邮电大学 |