发明名称 基于MapReduce的粗糙集并行约简方法、装置及系统
摘要 本发明提供了一种基于MapReduce的粗糙集并行约简方法、装置及系统,所述方法通过读取待约简决策表后,接着对所述决策表进行简化,再对所述简化后的决策表进行属性重要度并行计算处理,最后再进行属性重要度并行约简得到最终的约简结果,所述方法可以通过一次MapReduce算出所有属性的重要度,且在得到一个约简结果之后又重新删除简化决策表的冗余信息,使得简化决策表更加的精简,因此可以进一步的提高计算速度。另外,本发明提供的基于MapReduce的粗糙集并行约简装置及系统,其与所述方法一样,很好地解决现有技术中知识约简方法存在一定限制条件及不能高效地进行并行化约简的问题并使得储存空间得到进一步的优化。
申请公布号 CN104063230B 申请公布日期 2017.03.01
申请号 CN201410325508.9 申请日期 2014.07.09
申请人 中国科学院重庆绿色智能技术研究院 发明人 席大超;王国胤;张学睿;张帆;封雷;李广砥;邓伟辉;郭义帅;谢亮;董建华
分类号 G06F9/44(2006.01)I 主分类号 G06F9/44(2006.01)I
代理机构 上海光华专利事务所 31219 代理人 敖欢
主权项 一种基于MapReduce的粗糙集并行约简方法,其特征在于,包括:读取待约简决策表;初始化第一MapReduce模型并令其响应所述待约简决策表,以对所述待约简决策表进行并行计算处理得到带有标记的简化决策表:若所述简化决策表为空,则令其作为所述待约简决策表的最终约简结果并予以输出;若所述简化决策表为非空,则初始化第二MapReduce模型并令其响应所述带有标记的简化决策表,以并行计算得到所述带有标记的简化决策表中每个属性的重要度并将其结果写入Hadoop分布式文件系统中;读取Hadoop分布式文件系统中属性重要度最高的决策表并删除其中的冗余信息以得到新的待约简决策表,令所述新的待约简决策表作为所述第一MapReduce模型的输入值已进行重新约简。
地址 400714 重庆市北碚区方正大道266号