发明名称 一种数据处理方法和设备
摘要 本申请公开了一种数据处理方法和设备,包括:获取待处理的样本数据,并确定每一个样本数据的特征信息;根据特征信息中包含的特征,得到每一个特征对应的样本数据集合;针对其中一个特征对应的样本数据集合,根据设定的分位点个数,确定样本数据集合中每一个分位点,并计算每一个分位点的分裂参数值;根据每一个分位点的分裂参数值,确定针对样本数据的数据处理策略。使得在对样本数据进行处理时,只需要遍历确定的每一个分位点,而不再需要遍历每一个特征对应的样本数据,在待处理的数据量较大时,利用本申请实施例所提供的数据处理方法,可以有效地缩短数据处理的时间,进而提高数据处理的效率。
申请公布号 CN106599899A 申请公布日期 2017.04.26
申请号 CN201510662418.3 申请日期 2015.10.14
申请人 阿里巴巴集团控股有限公司 发明人 杜玮;李文鹏;褚崴;余舟华;施兴
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京国昊天诚知识产权代理有限公司 11315 代理人 许志勇
主权项 一种数据处理方法,其特征在于,包括:获取待处理的样本数据,并确定每一个所述样本数据的特征信息,其中,所述特征信息包含特征以及所述特征对应的特征值;根据所述特征信息中包含的特征,得到每一个特征对应的样本数据集合;针对其中一个特征对应的样本数据集合,根据设定的分位点个数,确定所述样本数据集合中每一个分位点,并计算每一个分位点的分裂参数值;根据每一个所述分位点的分裂参数值,确定针对所述样本数据的数据处理策略。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱