发明名称 |
一种数据分类回归方法及装置 |
摘要 |
本发明公开了一种数据分类回归方法及装置。方法为,将初始样本向量集合划分为连续类型数据序列、类别类型数据序列,以及二进制数据序列,并将连续类型数据序列、类别类型数据序列分别转化为二进制形式的第一向量序列以及第二向量序列,合并第一向量序列、第二向量序列,以及二进制数据序列,生成分类回归向量序列;根据该分类回归向量序列中的每一个向量,获取初始样本向量集合的分类回归结果。采用本发明技术方案,数据分类回归结果的获取不受数据维数以及数据数量的限制,并且无须采用迭代算法实现数据的分类回归,从而降低了获取数据分类回归结果的复杂度。 |
申请公布号 |
CN105138527A |
申请公布日期 |
2015.12.09 |
申请号 |
CN201410242170.0 |
申请日期 |
2014.05.30 |
申请人 |
华为技术有限公司 |
发明人 |
田光见;张夏天;范伟 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
黄志华 |
主权项 |
一种数据分类回归方法,其特征在于,包括:接收初始样本向量集合,并根据所述初始样本向量集合中每一个样本向量包含的数据类型,对所述初始样本向量集合进行划分,获取连续类型数据序列,类别类型数据序列,以及二进制数据序列;其中,所述初始样本向量集合中包含至少一个样本向量,所述样本向量包含样本对应的属性信息;所述连续类型数据序列用于表征所述属性信息中数字类型的属性信息;所述类别类型数据序列用于表征所述属性信息中非数字类型的属性信息;根据所述连续类型数据序列,生成二进制形式的第一向量序列;根据所述类别类型数据序列,生成二进制形式的第二向量序列;将所述第一向量序列、第二向量序列,以及所述二进制数据序列进行合并后,生成分类回归向量序列;其中,所述分类回归向量序列中包含多个向量;分别根据所述分类回归向量序列中的每一个向量,获取所述初始样本向量集合对应的各个类别回归哈希桶,并分别计算所述各个类别回归哈希桶对应的类别统计值,以及根据所述类别统计值获取所述初始样本向量集合的分类回归结果;其中,所述类别回归哈希桶中包含相应类别的样本数目。 |
地址 |
518129 广东省深圳市龙岗区坂田华为总部办公楼 |