发明名称 一种基于直方图的面向数据流差分隐私发布方法
摘要 本发明涉及一种基于直方图的面向数据流差分隐私发布方法,包括以下步骤:对于每一个时刻i,数据流接收的数据集为D<sub>i</sub>,对数据集D<sub>i</sub>中属性A出现的不同元素值进行统计,并按照元素值的大小升序排列,对频数进行归一化处理为P;记最后一次发布的含噪局部最优直方图所对应的真实数据的分布归一化后为Q,计算P与Q的EMD相似度τ;若τ>σ,则给数据集D<sub>i</sub>分配隐私预算<img file="DDA0000763974010000011.GIF" wi="169" he="107" />,其中,<img file="DDA0000763974010000012.GIF" wi="343" he="128" />,并给数据集D<sub>i</sub>添加相应的拉普拉斯噪声得到数据集O<sub>i</sub>;对数据集O<sub>i</sub>利用分组与合并策略,进行局部最优直方图发布。本发明在保证每个窗口中隐私总预算不超过ε时,发布数据的可用性较好。
申请公布号 CN105046160A 申请公布日期 2015.11.11
申请号 CN201510430312.0 申请日期 2015.07.21
申请人 东华大学 发明人 夏小玲;刘慧艺;石秀金;王绍宇;于守健
分类号 G06F21/60(2013.01)I 主分类号 G06F21/60(2013.01)I
代理机构 上海泰能知识产权代理事务所 31233 代理人 宋缨;孙健
主权项 一种基于直方图的面向数据流差分隐私发布方法,其特征在于,包括以下步骤:(1)对于每一个时刻i,数据流接收的数据集为D<sub>i</sub>,对数据集D<sub>i</sub>中属性A出现的不同元素值进行统计,并按照元素值的大小升序排列,对频数进行归一化处理为P;(2)记最后一次发布的含噪局部最优直方图所对应的真实数据的分布归一化后为Q,计算P与Q的EMD相似度τ;(3)若τ>σ,则给数据集D<sub>i</sub>分配隐私预算<img file="FDA0000763973990000011.GIF" wi="213" he="127" /><img file="FDA0000763973990000012.GIF" wi="389" he="148" />并给数据集D<sub>i</sub>添加相应的拉普拉斯噪声得到数据集O<sub>i</sub>,其中,σ为设定的阈值,ε为隐私总预算,w为滑动窗口大小,ε<sub>j</sub>为第j个子窗口已分配的预算大小;(4)对数据集O<sub>i</sub>利用分组与合并策略,进行局部最优直方图发布。
地址 201620 上海市松江区松江新城人民北路2999号