主权项 |
一种基于差分隐私的相关性时间序列发布方法,其特征在于:包括以下步骤,步骤S1,数据预处理,包括读入待保护的原始时间序列X,总长度记为n;利用预设长度l的观测窗口从原始时间序列X的第i个时刻开始提取数据,得到当前待处理的时间序列,记为W,W={x<sub>i</sub>,x<sub>i+1</sub>,…,x<sub>i+l‑1</sub>},数据x<sub>i</sub>∈X;令i=1;步骤S2,自相关函数计算,包括计算观测窗口内时间序列W的自相关函数<img file="FDA0001122604430000011.GIF" wi="219" he="71" />如下式,<img file="FDA0001122604430000012.GIF" wi="749" he="262" />其中,<img file="FDA0001122604430000013.GIF" wi="260" he="127" />为观测窗口序列中原始数据的均值;步骤S3,噪声生成,包括生成长度为l,自相关函数为<img file="FDA0001122604430000014.GIF" wi="179" he="71" />的拉普拉斯噪声序列Z;包括以下子步骤,步骤S3‑1,设定滤波器的冲激响应为<img file="FDA0001122604430000015.GIF" wi="410" he="167" />其中,N<sub>0</sub>是生成拉普拉斯噪声所需的高斯白噪声的功率谱密度;步骤S3‑2,生成长度为l,功率谱密度为N<sub>0</sub>的4个高斯白噪声序列G<sub>1</sub>、G<sub>2</sub>、G<sub>3</sub>和G<sub>4</sub>,其中高斯白噪声的分布满足<img file="FDA0001122604430000016.GIF" wi="675" he="95" />步骤S3‑3,将高斯白噪声序列G<sub>1</sub>、G<sub>2</sub>、G<sub>3</sub>和G<sub>4</sub>通过冲激响应为h(n)的滤波器,得到4个自相关函数为R<sub>G′</sub>(n)的相关性高斯噪声序列G′<sub>1</sub>、G′<sub>2</sub>、G′<sub>3</sub>和G′<sub>4</sub>,其中<img file="FDA0001122604430000017.GIF" wi="435" he="150" />步骤S3‑4,计算<img file="FDA0001122604430000018.GIF" wi="514" he="63" />得到特定相关性的拉普拉斯噪声序列Z,Z的自相关函数<img file="FDA0001122604430000019.GIF" wi="394" he="71" />步骤S4,噪声加入,包括根据自相关函数为<img file="FDA00011226044300000110.GIF" wi="363" he="79" />的拉普拉斯噪声序列Z中 的噪音数据,对观测窗口内未处理的数据叠加相应的噪音数据,计算W′=W+Z;步骤S5,迭代处理,包括向后滑动观测窗口,依次从原始时间序列X取下一时间序列,作为新的当前待处理的时间序列W,返回步骤S2,对观测窗口内未处理的数据加入噪声,得到含有噪声的子序列;直至待保护时间序列处理完毕,进入步骤S6;步骤S6,数据发布,包括发布经过加噪处理后的待保护时间序列。 |