发明名称 | 一种数据处理方法和设备 | ||
摘要 | 本申请公开了一种数据处理方法和设备,包括:获取待处理的样本数据,并确定每一个样本数据的特征信息;根据特征信息中包含的特征,得到每一个特征对应的样本数据集合;针对其中一个特征对应的样本数据集合,根据设定的分位点个数,确定样本数据集合中每一个分位点,并计算每一个分位点的分裂参数值;根据每一个分位点的分裂参数值,确定针对样本数据的数据处理策略。使得在对样本数据进行处理时,只需要遍历确定的每一个分位点,而不再需要遍历每一个特征对应的样本数据,在待处理的数据量较大时,利用本申请实施例所提供的数据处理方法,可以有效地缩短数据处理的时间,进而提高数据处理的效率。 | ||
申请公布号 | CN106599899A | 申请公布日期 | 2017.04.26 |
申请号 | CN201510662418.3 | 申请日期 | 2015.10.14 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 杜玮;李文鹏;褚崴;余舟华;施兴 |
分类号 | G06K9/62(2006.01)I | 主分类号 | G06K9/62(2006.01)I |
代理机构 | 北京国昊天诚知识产权代理有限公司 11315 | 代理人 | 许志勇 |
主权项 | 一种数据处理方法,其特征在于,包括:获取待处理的样本数据,并确定每一个所述样本数据的特征信息,其中,所述特征信息包含特征以及所述特征对应的特征值;根据所述特征信息中包含的特征,得到每一个特征对应的样本数据集合;针对其中一个特征对应的样本数据集合,根据设定的分位点个数,确定所述样本数据集合中每一个分位点,并计算每一个分位点的分裂参数值;根据每一个所述分位点的分裂参数值,确定针对所述样本数据的数据处理策略。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |