发明名称 一种基于采样间隔的数据分类数目的确定方法
摘要 本方法提出了一种基于采样间隔的数据分类数目的确定方法,该方法首先构造一个空间,该空间的维数为数据的维数,将待确定分类数的数据集的每一个数据看成以上空间中一个点,按照一定“间距”将以上空间分成多个子空间,对各个子空间统计数据点的个数,并设计一个与子空间对应的变量和标识位,用于存储各个子空间中的数据点数。在得到以上各个子空间的点数后,并从而得到每个子空间的数据。(统计每个子空间的数据点的个数)然后设置一个阈值,根据这个阈值判断各个子空间的数据是否超过该阈值,如果超过,对应标识位标记为1。最后判断以上标识位为1的子空间的连通性,有几个联通的区域,则以上数据就分为几类。
申请公布号 CN104298847A 申请公布日期 2015.01.21
申请号 CN201410325419.4 申请日期 2014.07.09
申请人 重庆大学 发明人 郭茂耘;兰天;刘正雷;柴毅;屈剑锋;董勇;王诗年
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 代理人
主权项 一种基于采样间隔的数据分类数目的确定方法,其特征在于,包括以下步骤:步骤一:将需要确定分类数目的数据集中每个数据作为多维空间中的一个点;步骤二:在多维空间中确定包含数据点的封闭体;步骤三:对以上封闭体按预设划分间隔进行划分,其预设间隔值可以根据需要设置;步骤四:统计各个子封闭体中的数据点数;步骤五:判断子封闭体所含数目是否大于设定阈值;步骤六:判断连通区域,连通区域的个数即为分类数。
地址 400044 重庆市沙坪坝区沙正街174号重庆大学