发明名称 一种海量数据挖掘技术
摘要 本发明涉及一种海量数据挖掘技术分解与合成过程中的决策表解空间不变性理论;海量数据环境下,决策表的快速分解与合成方法,以及快速离散化方法与知识约简方法;粒功能结构的形式化表示存储与低复杂度粒模型,以及在此基础上海量数据的动态获取知识方法等。在数据挖掘的研究中,快速排序是二维表一个重要操作。在基于Rogh集理论数据处理的海量中,可以利用二维表的快速排序划分操作来等价类。假定二维表中的数据(9条记录,m9个属性)服从均匀分布,二维表快速排序的平均时间复杂度为90(n×logn×m9)。然而,其平均时间复杂度为990(n×(logn+m)),当8m>logn时,990(n×(logn+m))≈0(n×m),基本保持了与6n的线性关系,这一结果将有助于处理海量数据方法的研究。
申请公布号 CN102110116A 申请公布日期 2011.06.29
申请号 CN200910250982.9 申请日期 2009.12.24
申请人 杨槐 发明人 杨槐
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种海量数据挖掘技术,数据存储方式和辅助存储空间。现有的算法读入内存后进行处理普遍多数采用将文本数据一次性的方法,且辅助存储空间最好的都只有50(9×m),
地址 400711 重庆市北碚区胜利村5号10号