发明名称 一种K-匿名改进方法
摘要 本发明公开了一种K-匿名改进方法,涉及数据挖掘领域,根据原始数据集选择准标识符,确定泛化方式,并建立与泛化方式对应的初始泛化格;判断初始泛化格是否为空,如果否,根据最优节点选择方式从初始泛化格的所有节点中选择出全局最优节点,获取第一泛化格;根据全局最优节点对待发布数据进行匿名化处理,获取匿名簇的数量;判断匿名簇的数量是否小于预设数量,如果是,对第一泛化格进行最优节点选择方式计算,获取最优节点;如果否,匿名簇为孤立簇,对第一泛化格进行二次K-匿名计算,获取最优节点;将待发布数据按照最优节点对应的泛化方式进行泛化,获取泛化后的数据,将泛化后的数据发布。本发明缩短了执行时间,提高了信息的准确性。
申请公布号 CN102156755A 申请公布日期 2011.08.17
申请号 CN201110117303.8 申请日期 2011.05.06
申请人 天津大学 发明人 张静
分类号 G06F17/30(2006.01)I;G06F21/00(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 天津市北洋有限责任专利代理事务所 12201 代理人 温国林
主权项 一种K‑匿名改进方法,其特征在于,所述方法包括以下步骤:(1)根据原始数据集选择准标识符,由所述准标识符确定泛化方式,并建立与所述泛化方式对应的初始泛化格;(2)判断所述初始泛化格是否为空,如果是,流程结束;如果否,执行步骤(3);(3)根据最优节点选择方式从所述初始泛化格的所有节点中选择出全局最优节点,获取第一泛化格;(4)根据所述全局最优节点对待发布数据进行匿名化处理,获取和所述全局最优节点相应的匿名簇的数量;(5)判断所述匿名簇的数量是否小于预设数量,如果是,执行步骤(6);如果否,执行步骤(7);(6)对所述第一泛化格进行所述最优节点选择方式计算,获取最优节点;(7)匿名簇为非孤立簇,对所述第一泛化格进行二次K‑匿名计算,获取所述最优节点;(8)将所述待发布数据按照所述最优节点对应的泛化方式进行泛化,获取泛化后的数据,将所述泛化后的数据发布,流程结束。
地址 300072 天津市南开区卫津路92号