发明名称 |
基于隐私保护的数据挖掘方法 |
摘要 |
本发明发明的基于隐私保护的数据挖掘方法,属于数据挖掘领域,尤其涉及基于隐私保护的数据挖掘方法。包含以下步骤:对原始真实数据进行变换步骤,对潜在的数字型属性数据进行离散化,再对所有属性设置转移概率矩阵;判定树的生成步骤,在服务器端,统计变换后的数据记录,利用变换后的训练样本数据集S、已经确定的分裂属性集、分裂点及数据子集标志,逐步递归生成判定树;分类规则的产生步骤,对上述已生成的判定树进行剪枝,产生分类规则。本方法可以适用于非字符型数据和非均匀分布的原始数据也可以变换标签属性,在变换后的数据集上构造的分类树具有较高的精度。 |
申请公布号 |
CN102929896A |
申请公布日期 |
2013.02.13 |
申请号 |
CN201110232932.5 |
申请日期 |
2011.08.13 |
申请人 |
句容今太科技园有限公司 |
发明人 |
丁力 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
基于隐私保护的数据挖掘方法,其特征是,包含以下步骤:原始真实数据的变换步骤,对潜在的数字型属性数据进行离散化,再对所有属性设置转移概率矩阵;判定树的生成步骤,在服务器端,统计变换后的数据记录,利用变换后的训练样本数据集S、已经确定的分裂属性集、分裂点及数据子集标志,逐步递归生成判定树;分类规则的产生步骤,对上述已生成的判定树进行剪枝,产生分类规则。 |
地址 |
212400 江苏省镇江市句容边城镇石坑村(今太科技创业园)1幢二层201室 |