发明名称 一种序列模式挖掘隐私数据保护方法
摘要 本发明涉及一种序列模式挖掘中的隐私数据保护方法。该方法是随机产生两个32位无符号整数,对数据拥有者所要保护的数据项进行随机置换,在进行序列模式挖掘之前,将数据库中的各事务用相应的二进制数表示,各位值即为该事务所对应的数据项,并采用一定的方法恢复置换后的数据,确保序列模式挖掘模块有正确的输入数据;对于恢复后的事务数据库,采用基于二进制形式的序列模式挖掘方法,来确定出频繁序列模式。该方法包括候选频繁序列模式的生成及其支持数的计算方法。本发明所采用方法除了能发现所有的序列模式外,与现有的序列模式挖掘方法相比,不但降低了算法的执行难度,而且能进一步提高算法的执行效率。
申请公布号 CN101561854B 申请公布日期 2011.03.30
申请号 CN200910027131.8 申请日期 2009.05.22
申请人 江苏大学 发明人 朱玉全;孙蕾;陈耿;胡天寒
分类号 G06F21/00(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F21/00(2006.01)I
代理机构 南京知识律师事务所 32207 代理人 卢亚丽
主权项 1.一种序列模式挖掘隐私数据保护方法,包括以下步骤:(1)隐私数据项的确定:根据数据拥有者的意愿确定要隐藏的隐私数据项;(2)隐私数据项的修改:原事务数据库中有n条记录,对原事务数据库中的事务进行分组,每32条记录为一组,不足部分补足,分组数为正整数m,每一组对应一个32位数a<sub>i</sub>,i=1,2,...,m;随机产生两个32位的正整数b<sub>1</sub>和b<sub>2</sub>;①给每一组的a<sub>i</sub>赋值,a<sub>i</sub>的第j位对应于第i组组内的第j条记录,其值即为该记录隐私数据项所对应的值,i=1,2,...,m,j=1,2,...,32;②执行a<sub>i</sub>and b<sub>1</sub>or b<sub>2</sub>,and为逻辑”与”操作,or为逻辑”或”操作,令a<sub>i</sub>‘=a<sub>i</sub>and b<sub>1</sub> or b<sub>2</sub>;(3)记录的整型化:将事务数据库中的各记录用相应的二进制数表示,各位位值即为该记录所对应的数据项,设对应的二进制数为R<sub>i</sub>’,i=1,2,...,n;(4)数据传输:用二进制数进行数据的传输;(5)隐私保护数据项的恢复:执行a<sub>i</sub> and<img file="FSB00000271960100011.GIF" wi="44" he="64" />or<img file="FSB00000271960100012.GIF" wi="64" he="64" />其中<img file="FSB00000271960100013.GIF" wi="149" he="64" />分别为对b<sub>2</sub>、b<sub>1</sub>执行逻辑”非”操作后的结果;令a<sub>i</sub>”=a<sub>i</sub> and<img file="FSB00000271960100014.GIF" wi="44" he="63" />or<img file="FSB00000271960100015.GIF" wi="64" he="62" />根据a<sub>i</sub>”修改R<sub>j</sub>’,修改后的值记为R<sub>j</sub>”,i=1,2,...,m,j=1,2,...,n;(6)序列模式的挖掘:对恢复后的事务数据库,采用基于二进制形式的序列模式挖掘方法,确定频繁序列模式;所说的序列模式的挖掘分为两步:候选频繁序列模式的生成、候选频繁序列模式支持数的计算。 
地址 212013 江苏省镇江市学府路301号