发明名称 一种基于知识粒度的矩阵增量约简方法
摘要 本发明公开了一种基于知识粒度的矩阵增量约简方法,包括如下步骤:首先利用等价关系矩阵计算已有决策表(称为旧决策表)的最小属性约简(RED<sub>U</sub>);接着当一些新对象添加到旧决策表后(称为新决策表),通过矩阵增量方法计算旧决策表中最小属性约简的知识粒度和新决策表的知识粒度,并判断他们是否相等,如不相等,在新决策表中利用矩阵增量方法计算除RED<sub>U</sub>之外所有属性的外部重要性,并依次循环选取其中外部重要性最大的属性添加到RED<sub>U</sub>中,再计算RED<sub>U</sub>的知识粒度,直到其与新决策表的知识粒度相等为止;最后循环删除RED<sub>U</sub>中的冗余属性,得到新决策表的最小属性约简。本发明有效地解决了决策表中对象动态增加时快速求解最小属性约简的问题,从而有助于提高知识发现的效率。
申请公布号 CN104462020A 申请公布日期 2015.03.25
申请号 CN201410562442.5 申请日期 2014.10.21
申请人 西南交通大学 发明人 李天瑞;景运革;余增
分类号 G06F17/16(2006.01)I 主分类号 G06F17/16(2006.01)I
代理机构 成都信博专利代理有限责任公司 51200 代理人 张澎
主权项 一种基于知识粒度的矩阵增量约简方法,利用旧决策表计算约简的过程中已经得到的结果—包括旧决策表的知识粒度、属性外部重要性及最小属性约简来计算新决策表的知识粒度、外部重要性及最小属性约简,避免重复计算,具体包括如下步骤:步骤1:输入旧决策表及其最小属性约简RED<sub>U</sub>、C‑RED<sub>U</sub>中每个属性a相对于RED<sub>U</sub>的外部重要性<img file="re-FDA0000657907620000011.GIF" wi="381" he="66" />知识粒度GP<sub>U</sub>(D|C)、RED<sub>U</sub>的知识粒度GP<sub>U</sub>(D|RED<sub>U</sub>)和增量数据集U<sub>X</sub>={x<sub>n+1</sub>,x<sub>n+2</sub>,…,x<sub>n+t</sub>};步骤2:计算增加对象后新决策表的等价关系矩阵<img file="re-FDA0000657907620000012.GIF" wi="318" he="75" />步骤3:在旧决策表知识粒度GP<sub>U</sub>(D|C)和最小属性约简GP<sub>U</sub>(D|RED<sub>U</sub>)基础上,利用增量方法计算新决策表知识粒度<img file="re-FDA0000657907620000013.GIF" wi="262" he="69" />和RED<sub>U</sub>的知识粒度<img file="re-FDA0000657907620000014.GIF" wi="371" he="69" />如果<img file="re-FDA0000657907620000015.GIF" wi="632" he="69" />则跳转到步骤5,否则跳转到步骤4;步骤4:当<img file="re-FDA0000657907620000016.GIF" wi="650" he="69" />在旧决策表属性子集C‑RED<sub>U</sub>中每个属性a相对于RED<sub>U</sub>的外部重要性<img file="re-FDA0000657907620000017.GIF" wi="354" he="66" />基础上,通过增量方法计算新决策表属性子集C‑RED<sub>U</sub>中每个属性a相对于RED<sub>U</sub>的外部重要性<img file="re-FDA0000657907620000018.GIF" wi="397" he="72" />依次循环选取最大的属性重要性<img file="re-FDA00006579076200000119.GIF" wi="713" he="72" />添加到RED<sub>U</sub>中,即RED<sub>U</sub>←RED<sub>U</sub>∪{a<sub>0</sub>},计算增加a<sub>0</sub>后RED<sub>U</sub>的知识粒度直到其与新决策表的知识粒度相等为止;步骤5:在新决策表中,从后向前遍历RED<sub>U</sub>中的每一个属性a,利用矩阵方法计算RED<sub>U</sub>删除属性a后的知识粒度<img file="re-FDA00006579076200000110.GIF" wi="451" he="69" />如果<img file="re-FDA00006579076200000111.GIF" wi="736" he="69" />则删除属性a,即RED<sub>U</sub>←RED<sub>U</sub>‑{a}。最后得到的RED<sub>U</sub>为新决策表的最小属性约简;步骤6:<img file="re-FDA00006579076200000112.GIF" wi="365" he="68" />输出新决策表的最小属性约简<img file="re-FDA00006579076200000113.GIF" wi="193" he="68" />其中GP<sub>U</sub>(D|C)为旧决策表的知识粒度,GP<sub>U</sub>(D|RED<sub>U</sub>)为旧决策表中RED<sub>U</sub>的知识粒度,<img file="re-FDA00006579076200000114.GIF" wi="354" he="66" />为旧决策表属性子集C‑RED<sub>U</sub>中属性a相对于RED<sub>U</sub>的外部重要性,RED<sub>U</sub>为旧决策表的最小属性约简,<img file="re-FDA00006579076200000115.GIF" wi="298" he="75" />为新决策表的等价关系矩阵,其中<img file="re-FDA00006579076200000116.GIF" wi="260" he="69" />为新决策表的知识粒度,<img file="re-FDA00006579076200000117.GIF" wi="337" he="69" />为新决策表中RED<sub>U</sub>的知识粒度,<img file="re-FDA00006579076200000118.GIF" wi="371" he="72" />为 新决策表属性子集C‑RED<sub>U</sub>中属性a相对于RED<sub>U</sub>的外部重要性,<img file="re-FDA0000657907620000021.GIF" wi="426" he="69" />为新决策表中RED<sub>U</sub>除去属性a的知识粒度,<img file="re-FDA0000657907620000022.GIF" wi="173" he="68" />为新决策表的最小属性约简。
地址 610031 四川省成都市二环路北一段111号西南交通大学科技处