发明名称 面向微数据的快速匿名隐私算法
摘要 本发明公开了一种面向微数据的快速匿名隐私算法,涉及匿名隐私保护技术领域。本发明将集合中同一律的思想和Incognito算法相结合,提出了F‑Incognito算法。F‑Incognito算法将其中一个达到最高级别泛化属性的节点看成全集,利用A与全集的交集等于A的思想,对其他属性组成的节点进行判断,有效减少了等价类数量的计算量。实验表明:该算法能够保留Incognito算法得特点,同时提高了求解泛化节点表的时间效率,时间缩短比例高达60%。因此,F‑Incognito算法在处理大数据集时,具有显著优势。
申请公布号 CN106096453B 申请公布日期 2017.03.08
申请号 CN201610475467.0 申请日期 2016.06.27
申请人 徐州医科大学 发明人 吴响;俞啸;魏裕阳;王换换
分类号 G06F21/62(2013.01)I 主分类号 G06F21/62(2013.01)I
代理机构 南京钟山专利代理有限公司 32252 代理人 李小静
主权项 一种面向微数据的快速匿名隐私算法,其特征在于:输入:数据表T;准标识符集QI,匿名约束k;输出:满足k‑匿名的全域泛化表格,具体步骤如下:1)根据各属性值可能的泛化值形成泛化格,其中C<sub>i</sub>为网格中的节点集,E<sub>i</sub>为网格中的边集;2)各属性值最高泛化级别集合表示为MGL;3)首先,设有空队列queue;4)设准标志符个数为n,i为变量,i初始值为1且小于n,进入以下循环;5)当i&gt;1时获取C<sub>i‑1</sub>,设C<sub>i</sub>中E<sub>i</sub>没有变直接到达的节点集为roots;6)把roots中的节点插入到queue中;7)设变量node,取出queue中的一个节点插入到node中;如果node没被标记过,同时node的各属性泛化级别存在一个属性在MGL中的属性泛化级别,并且node的其他属性组成的节点在C<sub>i‑1</sub>中,则把node的直接泛化节点标记;如果node被标记过则删除该节点,并把node的直接泛化节点插入到queue中,直到queue为空;8)计算node泛化数据表的等价类;如果node泛化数据表T满足k‑匿名,那么标记node的直接泛化节点;否则将node节点从C<sub>i</sub>中删除,并把node的直接泛化节点插入到queue;9)通过删除后的节点C<sub>i</sub>和E<sub>i</sub>生成C<sub>i+1</sub>和E<sub>i+1</sub>;10)返回所有满足k‑匿名的泛化节点表。
地址 221004 江苏省徐州市铜山路209号