发明名称 一种基于相关性去除的差分隐私数据发布方法及系统
摘要 一种基于相关性去除的差分隐私数据发布方法及系统,各数据拥有者分别对自己的原始数据集进行分段并得到差值数据集,对差值数据集的前两项求和并加噪,然后同态加密后上传给云服务提供商,云服务提供商进行同态解密运算;各数据拥有者对差值数据集项进行变换得到变换系数,加入由相互独立且服从高斯分布的白噪声所组成的平稳噪声;数据拥有者进行逆小波变换得到加扰后的数据集,上传到云服务提供商;云服务提供商利用维纳滤波进行滤波,当数据使用者请求数据集时,云服务提供商对求精后的数据集进行反变换,发布给第三方数据使用者的数据项。本发明有效减少了数据计算量和交互量,提高了资源利用率和数据可用性。
申请公布号 CN105608388A 申请公布日期 2016.05.25
申请号 CN201510617903.9 申请日期 2015.09.24
申请人 武汉大学 发明人 徐正全;王豪;王涛;贾姗
分类号 G06F21/62(2013.01)I;H04L29/08(2006.01)I 主分类号 G06F21/62(2013.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 严彦
主权项 一种基于相关性去除的差分隐私数据发布方法,其特征在于:包括以下步骤,步骤S1,各数据拥有者分别对自己的原始数据集X进行预处理,预处理包括以下子步骤,步骤S1‑1,对原始数据集X进行分段,设得到N个分段,所得第i个分段数据集记为X<sup>i</sup>={x<sub>1</sub><sup>i</sup>,x<sub>2</sub><sup>i</sup>,…,x<sub>n</sub><sup>i</sup>},X<sup>i</sup>∈X,i=1,2,…,N,其中n为分段数据集的长度;步骤S1‑2,计算各分段数据集第j项x<sub>j</sub><sup>1</sup>,x<sub>j</sub><sup>2</sup>,…,x<sub>j</sub><sup>N</sup>的和,所得新的数据集记为S={s<sub>1</sub>,s<sub>2</sub>,…,s<sub>n</sub>},其中第j项<img file="FDA0000810795480000011.GIF" wi="241" he="141" />i=1,2,…,N,j=1,2,…,n;步骤S1‑3,计算得到差值数据集,记为S'={s<sub>1</sub>,s<sub>2</sub>,Δs<sub>3</sub>,…,Δs<sub>n</sub>},其中Δs<sub>3</sub>取第三项s<sub>3</sub>和前两项s<sub>1</sub>,s<sub>2</sub>均值的差值,Δs<sub>4</sub>为s<sub>4</sub>和s<sub>3</sub>进行d阶差值得到,Δs<sub>5</sub>为s<sub>5</sub>s<sub>4</sub>进行d阶差值得到…Δs<sub>n</sub>为s<sub>n</sub>和前一项s<sub>n‑1</sub>进行d阶差值得到;步骤S2,各数据拥有者分别对差值数据集的前两项求和并加噪,然后利用同态加密方案加密后上传给云服务提供商,云服务提供商在得到所有数据拥有者的加密数据后进行同态解密运算得到各数据拥有者含有噪声的前两项的和;包括以下子步骤,步骤S2‑1,各数据拥有者分别处理,包括首先对差值数据集S'中的前两项数据s<sub>1</sub>、s<sub>2</sub>求和,得到m=s<sub>1</sub>+s<sub>2</sub>,在m中加入高斯白噪声g,得到m'=m+g,然后利用同态加密方案加密m';设加密过程为Enc(·),则云服务提供商得到加密后的密文C<sub>p</sub>=Enc(m+g),p∈{1,2,…,P},P为数据拥有者的个数;步骤S2‑2,云服务提供商在得到P个数据拥有者的加密密文后,进行相应同态解密运算,设解密过程为Dec(·),则解密后的明文<img file="FDA0000810795480000012.GIF" wi="358" he="143" />d为P个数据拥有者含有噪声的前两项的明文和;步骤S3,各数据拥有者对差值数据集项进行变换,得到变换系数,包括记差值数据集S'除s<sub>1</sub>,s<sub>2</sub>两项之外的n‑2项Δs<sub>3</sub>,…,Δs<sub>n</sub>组成数据集S<sup>'n‑2</sup>,对数据集S<sup>'n‑2</sup>进行离散小波变换,设变换系数记为F<sup>k</sup>={c<sub>0</sub>,c<sub>1</sub>,…,c<sub>k‑1</sub>},其中k是变换系数个数;步骤S4,各数据拥有者分别对变换系数F<sup>k</sup>加入由相互独立且服从高斯分布的白噪声所组成的平稳噪声;步骤S5,各数据拥有者对加噪后的变换系数F<sup>'k</sup>进行逆小波变换得到加扰后的数据集<img file="FDA0000810795480000021.GIF" wi="125" he="87" />上传到云服务提供商;步骤S6,云服务提供商利用维纳滤波对数据集<img file="FDA0000810795480000022.GIF" wi="197" he="94" />进行滤波,得到求精后的数据集<img file="FDA0000810795480000023.GIF" wi="229" he="95" />步骤S7,当数据使用者请求数据集时,云服务提供商对求精后的数据集<img file="FDA0000810795480000024.GIF" wi="199" he="94" />进行反变换,若数据集<img file="FDA0000810795480000025.GIF" wi="103" he="86" />的差值数据项为Δs<sub>j</sub>',则反变换后得到数据项<img file="FDA0000810795480000026.GIF" wi="357" he="135" /><img file="FDA0000810795480000027.GIF" wi="53" he="71" />是要发布给第三方数据使用者的数据项。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学