发明名称 一种隐私保护数据共享发布方法
摘要 本发明公开了一种隐私保护数据共享发布方法,包括如下步骤:用户通过服务器接口提交数据集,服务器判断数据集维数,若为奇数,则增加一个属性,该维数据属性值置零,将属性随机两两分组;分析数据集中数据点间的距离关系,确定阿基米德螺线旋转参数,借助阿基米德螺线的几何性质,对原始数据中属性值对进行阿基米德螺线旋转变换,生成变换后数据集。本发明通过维持原始数据集任意三个数据记录间距离关系稳定实现隐藏前后数据集聚类效果相同(或相似),实现有效兼顾聚类可用性和数据隐私安全性的隐私保护数据共享发布。
申请公布号 CN102147814A 申请公布日期 2011.08.10
申请号 CN201110097921.0 申请日期 2011.04.19
申请人 东南大学 发明人 倪巍伟;陆介平;崇志宏;黄茂峰
分类号 G06F17/30(2006.01)I;G06F21/00(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 柏尚春
主权项 1.一种隐私保护数据共享发布方法,其特征在于,包括如下步骤:(1)用户向服务器提交包含n条记录的原始数据集D,D包含m个属性列I<sub>1</sub>,I<sub>2</sub>,…,I<sub>m</sub>;(2)若所述步骤(1)中的m为奇数,则转到步骤(3),若m为偶数,则转到步骤(4);(3)为D生成第m+1个属性列I<sub>m+1</sub>,D中n条记录在属性列I<sub>m+1</sub>上的取值均为0;(4)将D中属性列随机两两分组,得到m/2或(m+1)/2个属性列对(I<sub>i</sub>,I<sub>j</sub>),1≤i≠j≤m+1;(5)对D中任意三个满足AB≥AC≥BC的不同的数据点A、B、C,生成基于阿基米德螺线旋转数据变换后保持所述三个数据点距离关系保持稳定的旋转参数取值范围β<sub>k</sub>,k∈[1,2,3,...,<img file="FDA0000056011150000011.GIF" wi="47" he="56" />];(6)生成原始数据集D的阿基米德螺线旋转参数取值范围β<sub>0</sub>:<maths num="0001"><![CDATA[<math><mrow><msub><mi>&beta;</mi><mn>0</mn></msub><mo>=</mo><msubsup><mi>I</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><msubsup><mi>C</mi><mi>n</mi><mn>3</mn></msubsup></msubsup><msub><mi>&beta;</mi><mi>k</mi></msub><mo>;</mo></mrow></math>]]></maths>(7)选取满足ε×α∈β<sub>0</sub>的螺距参数ε与旋转角度α,对D中各属性对的投影数据子集进行阿基米德螺线旋转,生成变换后投影数据子集;(8)若m为奇数,将变换后I<sub>m+1</sub>属性列及其配对属性列合并,并与其它变换后投影数据子集进行并操作,生成D的变换后数据集D′;若m为偶数,对变换后所有投影数据子集进行并操作,生成D的变换后数据集D′。
地址 210096 江苏省南京市玄武区四牌楼2号