发明名称 应用定向搜索的后向粗糙集属性约简方法
摘要 一种应用定向搜索的后向粗糙集属性约简方法,利用属性子集的互信息和冗余协同系数作为粗糙集属性约简的度量,从经过排序的初始属性集出发,从初始属性集的孩子子集中选取若干个冗余协同系数最小的等价属性子集,存储在定向存储区;然后再从这些等价属性子集出发,从它们的孩子子集中选取若干个冗余协同系数最小的等价属性子集作进一步搜索,以此类推,直到不能够找到等价属性子集为止,最后存储在定向存储区的属性子集就是属性约简结果。本发明方法实现灵活简单,针对性强,通用性强,具有多项式时间复杂度,可应用于所有粗糙集属性约简领域。
申请公布号 CN1300730C 申请公布日期 2007.02.14
申请号 CN200410067151.5 申请日期 2004.10.14
申请人 上海交通大学 发明人 杨胜;施鹏飞
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 上海交达专利事务所 代理人 毛翠莹
主权项 1、一种应用定向搜索的后向粗糙集属性约简方法,其特征在于包括如下步骤:1)初始化:将初始属性集中的每个属性按照互信息从小到大重新排列,互信息小的属性排在前面,互信息大的属性排在后面,并且将经过排序后的初始属性集存入定向存储区中;2)定向搜索:清空暂态存储区;对于定向存储区中的初始属性集,根据冗余协同系数特性,通过依次从前往后删除一个属性来找到它的M个冗余协同系数最小的孩子等价属性子集,也就是前M个孩子等价属性子集,记作属性子集存入暂态存储区,其中,冗余协同系数<math> <mrow> <mi>RSC</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>;</mo> <mi>P</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>I</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>a</mi> </munderover> <mi>i</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>;</mo> <mi>P</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow> </math> A={fi|i=1,..,a},A表示属性子集,fi表示属性,I(A;P)表示A与分类属性P的互信息,I(fi;P)表示fi与分类属性P的互信息;如果孩子等价属性子集个数小于M个,则取全部孩子等价属性子集存入暂态存储区;其中M的取值根据初始属性集的大小设定一个初始值,并随运算时间长短进行调整,初始属性集越大,M的初始值就取得越小,运算时间长则减少M的取值,反之则增大M的取值;3)定向搜索停止条件判别:如果暂态存储区包含属性子集,则清空定向存储区,从暂态存储区中找出冗余协同系数最小的M个属性子集,存入定向存储区,如果暂态存储区中的属性子集小于M个,则取暂态存储区中的全部属性子集存入定向存储区,然后对于定向存储区中的每个属性子集,按步骤2)对初始属性集处理的同样方法继续进行定向搜索;如果暂态存储区不包含属性子集,则输出定向存储区中的所有属性子集,由此得到属性约简结果。
地址 200240上海市闵行区东川路800号
您可能感兴趣的专利