发明名称 一种基于层次随机森林的多标签分类方法
摘要 本发明公开了一种基于层次随机森林的多标签分类方法,所述方法包括:从训练数据集中随机抽取一部分数据,使用这部分随机抽取的数据训练一棵层次树,层次树中节点的分列基于节点中所有数据的标签的聚类结果,重复建立多棵层次树,进而建立层次随机森林作为多标签分类器,并使用建立的层次随机森林多标签分类器对无标签的对象进行分类。该方法利用数据的多个标签之间总有一定的关联性的基本思想,基于标签的聚类结果建立层次树,并为树的每个节点都建立一个分类器;使用随机森林的思想,建立层次随机森林,充分考虑标签之间关联的各种可能性,泛化层次树的分类误差,提高多标签分类问题的速度和准确度。
申请公布号 CN105868773A 申请公布日期 2016.08.17
申请号 CN201610171082.5 申请日期 2016.03.23
申请人 华南理工大学 发明人 吴庆耀;谭明奎;陈健;林世杭;黄翰
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 何淑珍
主权项 一种基于层次随机森林的多标签分类方法,其特征在于:包括以下步骤:S1、从训练数据集中随机抽取一部分数据;S2、使用步骤S1抽取的数据建立一棵层次树;S3、重复步骤S1‑S2,建立层次随机森林作为多标签分类器即层次随机森林分类器;S4、使用步骤S3建立的多标签分类器对无标签的对象进行分类。
地址 510640 广东省广州市天河区五山路381号