发明名称 |
一种基于随机森林加权距离的大规模高维数据分类方法 |
摘要 |
本发明公开了一种基于随机森林加权距离的大规模高维数据分类方法,所述方法对训练样本利用随机森林算法计算各维度重要性,以维度重要性数值加权标准化距离,利用k近邻算法进行分类。本发明分类方法可解决所有分类问题,尤其适合于解决大规模高维数据的分类问题,该方法同样适用于大规模高维数据的回归问题。 |
申请公布号 |
CN104915679A |
申请公布日期 |
2015.09.16 |
申请号 |
CN201510272419.7 |
申请日期 |
2015.05.26 |
申请人 |
浪潮电子信息产业股份有限公司 |
发明人 |
韦鹏;付兴旺;吴楠;朱英澍 |
分类号 |
G06K9/62(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
济南信达专利事务所有限公司 37100 |
代理人 |
张靖 |
主权项 |
一种基于随机森林加权距离的大规模高维数据分类方法,其特征在于:所述方法对训练样本利用随机森林算法计算各维度重要性,以维度重要性数值加权标准化距离,利用k近邻算法进行分类。 |
地址 |
250101 山东省济南市高新区浪潮路1036号 |