发明名称 |
可收缩步长的多类别集成学分类方法 |
摘要 |
本发明涉及可收缩步长的多类别集成学分类方法,该方法首先将原始数据进行预处理,转换成分类方法可以处理的数据格式,获得训练数据集和待分类数据集;然后初始化训练数据集样本权重;然后依据训练数据集样本权重以及训练步长,训练M个基分类器,其中根据需要收缩步长;然后集成所有基分类器,得到最终判别分类器,对待分类数据集进行分类;最后将分类结果保存到文件中,提供分类预测的参考。本发明解决了因使用固定步长导致的最终分类界面没有最优化,分类预测精度欠佳的问题,同时省去了使用线搜索估计带来的时间开销。 |
申请公布号 |
CN104573012A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201510010781.7 |
申请日期 |
2015.01.09 |
申请人 |
上海大学 |
发明人 |
吴悦;严超 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I;G06K9/66(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海上大专利事务所(普通合伙) 31205 |
代理人 |
陆聪明 |
主权项 |
一种可收缩步长的多类别集成学习分类方法,其特征在于该方法具体步骤如下:A. 将原始数据进行预处理,转换成分类方法可以处理的数据格式,同时获得训练数据集和待分类数据集;B. 初始化训练数据集样本权重;C. 从m=1到M迭代,依据训练数据集样本权重以及训练步长,训练M个基分类器;D. 集成步骤C中的所有基分类器,得到最终判别分类器,对待分类数据集进行分类;E. 将分类结果保存到文件中,提供分类预测的参考。 |
地址 |
200444 上海市宝山区上大路99号 |