发明名称 一种基于包含度的模糊粗糙单调数据挖掘方法
摘要 本发明参照模糊粗糙集的理论,提出基于包含度的模糊粗糙单调数据挖掘方法,通过对决策属性和条件属性按值重新排列后,然后对重新排列后的集合进行区间划分,然后根据各个区间的隶属函数和各个区间的包含度,设定判定规则,对决策属性和条件属性之间的关系进行判断,从而建立模糊包含单调依赖关系模型;通过关系模型挖掘决策属性和条件属性之间的初步关系,设定决策过虑规则,求出条件属性约简的数据集和最优数据,现有的属性约简算法一般针对有限的数据值集,本发明可以针对海量的不规则数据,而且数据量越大,越能体现算法的优越性。
申请公布号 CN102609469A 申请公布日期 2012.07.25
申请号 CN201210014555.2 申请日期 2012.01.16
申请人 华南师范大学 发明人 梁瑾
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 禹小明
主权项 一种基于包含度的模糊粗糙单调数据挖掘方法,其特征在于,包括:(1)决策属性D的数据值的集合重新排序,形成有序集合D′;条件属性Ci的数据值的集合重新排序,形成有序集合Ci′;(2)对象集合U根据D′,得到对象重新排列的有序集合UD,对象集合U根据Ci′,得到对象重新排列的有序集合Ui;(3)根据UD和Ui中对象的决策属性值与条件属性值之间的关系,以及UD和Ui之间按划分所得的包含度,设定判定规则,对决策属性和条件属性之间的关系进行判断,从而建立模糊包含单调依赖关系模型;所述判断规则如下:对UD和Ui进行区间划分,并对根据划分出来的对应区间的隶属函数值进行判断,若小于0.5则重新对UD和Ui进行区间划分,若大于0.5,则求出UD和Ui划分的区间中最后一个区间的元素个数与这次划分设定的元素个数k的比值l;当隶属函数值大于0.5时,若l值小于0.5,或者当l值大于0.5时,最后一个区间隶属函数值不为零,则判定决策属性D和条件属性Ci是模糊包含单调依赖关系;(4)根据决策属性D和条件属性Ci是模糊包含单调依赖关系,建立决策属性和条件属性的模糊包含单调依赖关系模型,挖掘出与决策属性D有模糊包含单调依赖关系的条件属性形成数据挖掘的初步集合;(5)设定决策过虑规则,求出条件属性约简的数据集和最优数据。
地址 510631 广东省广州市天河区中山大道西55号