摘要 |
本发明涉及一种海量数据挖掘技术分解与合成过程中的决策表解空间不变性理论;海量数据环境下,决策表的快速分解与合成方法,以及快速离散化方法与知识约简方法;粒功能结构的形式化表示存储与低复杂度粒模型,以及在此基础上海量数据的动态获取知识方法等。在数据挖掘的研究中,快速排序是二维表一个重要操作。在基于Rogh集理论数据处理的海量中,可以利用二维表的快速排序划分操作来等价类。假定二维表中的数据(9条记录,m9个属性)服从均匀分布,二维表快速排序的平均时间复杂度为90(n×logn×m9)。然而,其平均时间复杂度为990(n×(logn+m)),当8m>logn时,990(n×(logn+m))≈0(n×m),基本保持了与6n的线性关系,这一结果将有助于处理海量数据方法的研究。 |