发明名称 一种基于多支撑点索引的离群检测方法及其系统
摘要 本发明提供了一种基于多支撑点索引的离群检测方法,包括:选取支撑点步骤:读入数据集,在所述数据集中选取多个支撑点以形成支撑点集;建立索引步骤:通过数据集中每个对象与所选取的多个支撑点计算距离并将距离作为坐标,形成多维数据空间,利用所述多维数据空间建立索引;离群检测步骤:划分索引为数据块,并对所述数据块进行逐块检测离群点。本发明还提供一种基于多支撑点索引的离群检测系统。本发明提供的技术方案通过选取多个支撑点与全局数据集计算距离来建立索引,避免单支撑点导致的数据空间扭曲,对数据集中的所有稀疏区域优先检测,能更快地提升离群度阈值,提高离群检测速度。
申请公布号 CN105975519A 申请公布日期 2016.09.28
申请号 CN201610278832.9 申请日期 2016.04.28
申请人 深圳大学 发明人 许红龙;毛睿;陆敏华;廖好;李荣华;王毅;刘刚
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市恒申知识产权事务所(普通合伙) 44312 代理人 王利彬
主权项 一种基于多支撑点索引的离群检测方法,其特征在于,所述方法包括:选取支撑点步骤:读入数据集,在所述数据集中选取多个支撑点以形成支撑点集;建立索引步骤:通过数据集中每个对象与所选取的多个支撑点计算距离并将距离作为坐标,形成多维数据空间,利用所述多维数据空间建立索引;离群检测步骤:划分索引为数据块,并对所述数据块进行逐块检测离群点。
地址 518060 广东省深圳市南山区南海大道3688号