发明名称 基于差分隐私的相关性时间序列发布方法及系统
摘要 本发明提供一种基于差分隐私的相关性时间序列发布方法及系统,包括通过预设长度的观测窗口将待发布原始序列分段,并将观测窗口内的子序列段作为短时平稳过程处理;首先计算窗口内子序列的自相关函数,然后生成与子序列自相关函数一致的相关性拉普拉斯噪声序列,最后将噪声叠加到子序列中,待原始序列处理完毕后,发布含有噪声的序列。本发明中的滑动窗口机制和相关性拉普拉斯噪声机制的运用,解决了现有利用差分隐私机制发布相关性时间序列的方法中,面临的实际有效的隐私保护强度无法达到预设值及数据可用性较低的问题。
申请公布号 CN106407841A 申请公布日期 2017.02.15
申请号 CN201610859701.X 申请日期 2016.09.28
申请人 武汉大学 发明人 徐正全;王豪;王涛;熊文君
分类号 G06F21/62(2013.01)I 主分类号 G06F21/62(2013.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 严彦
主权项 一种基于差分隐私的相关性时间序列发布方法,其特征在于:包括以下步骤,步骤S1,数据预处理,包括读入待保护的原始时间序列X,总长度记为n;利用预设长度l的观测窗口从原始时间序列X的第i个时刻开始提取数据,得到当前待处理的时间序列,记为W,W={x<sub>i</sub>,x<sub>i+1</sub>,…,x<sub>i+l‑1</sub>},数据x<sub>i</sub>∈X;令i=1;步骤S2,自相关函数计算,包括计算观测窗口内时间序列W的自相关函数<img file="FDA0001122604430000011.GIF" wi="219" he="71" />如下式,<img file="FDA0001122604430000012.GIF" wi="749" he="262" />其中,<img file="FDA0001122604430000013.GIF" wi="260" he="127" />为观测窗口序列中原始数据的均值;步骤S3,噪声生成,包括生成长度为l,自相关函数为<img file="FDA0001122604430000014.GIF" wi="179" he="71" />的拉普拉斯噪声序列Z;包括以下子步骤,步骤S3‑1,设定滤波器的冲激响应为<img file="FDA0001122604430000015.GIF" wi="410" he="167" />其中,N<sub>0</sub>是生成拉普拉斯噪声所需的高斯白噪声的功率谱密度;步骤S3‑2,生成长度为l,功率谱密度为N<sub>0</sub>的4个高斯白噪声序列G<sub>1</sub>、G<sub>2</sub>、G<sub>3</sub>和G<sub>4</sub>,其中高斯白噪声的分布满足<img file="FDA0001122604430000016.GIF" wi="675" he="95" />步骤S3‑3,将高斯白噪声序列G<sub>1</sub>、G<sub>2</sub>、G<sub>3</sub>和G<sub>4</sub>通过冲激响应为h(n)的滤波器,得到4个自相关函数为R<sub>G′</sub>(n)的相关性高斯噪声序列G′<sub>1</sub>、G′<sub>2</sub>、G′<sub>3</sub>和G′<sub>4</sub>,其中<img file="FDA0001122604430000017.GIF" wi="435" he="150" />步骤S3‑4,计算<img file="FDA0001122604430000018.GIF" wi="514" he="63" />得到特定相关性的拉普拉斯噪声序列Z,Z的自相关函数<img file="FDA0001122604430000019.GIF" wi="394" he="71" />步骤S4,噪声加入,包括根据自相关函数为<img file="FDA00011226044300000110.GIF" wi="363" he="79" />的拉普拉斯噪声序列Z中 的噪音数据,对观测窗口内未处理的数据叠加相应的噪音数据,计算W′=W+Z;步骤S5,迭代处理,包括向后滑动观测窗口,依次从原始时间序列X取下一时间序列,作为新的当前待处理的时间序列W,返回步骤S2,对观测窗口内未处理的数据加入噪声,得到含有噪声的子序列;直至待保护时间序列处理完毕,进入步骤S6;步骤S6,数据发布,包括发布经过加噪处理后的待保护时间序列。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学