发明名称 |
机器学模型训练方法及装置 |
摘要 |
本发明公开了一种机器学模型训练方法及装置;方法包括:基于训练集中各样本初始化的第一权重和第二权重、并基于各样本的特征为粒度对机器学模型进行训练;基于训练集中各样本的预测损失,确定相应目标变量被预测错误的第一样本集合,以及相应目标变量被预测正确的第二样本集合;基于第一样本集合中各样本的预测损失、以及相应的第一权重确定第一样本集合的整体预测损失;基于第一样本集合的整体预测损失提升第一样本集中各样本的第一权重和第二权重;将训练集中各样本更新后的第二权重、以及各样本的特征和目标变量输入机器学模型,以各样本的特征为粒度对机器学模型进行训练。实施本发明,能够提升机器学模型的预测精度和训练效率。 |
申请公布号 |
CN106548210A |
申请公布日期 |
2017.03.29 |
申请号 |
CN201610979377.5 |
申请日期 |
2016.10.31 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
赵伟;冯亚兵;廖宇;赖俊斌;柴海霞;潘宣良;刘黎春 |
分类号 |
G06K9/62(2006.01)I;G06Q10/06(2012.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京派特恩知识产权代理有限公司 11270 |
代理人 |
张振伟;张颖玲 |
主权项 |
一种机器学习模型训练方法,其特征在于,包括:基于训练集中各样本初始化的第一权重和第二权重、并基于各样本的特征为粒度对机器学习模型进行训练;基于所述训练集中各样本的预测损失,确定相应目标变量被预测错误的第一样本集合,以及相应目标变量被预测正确的第二样本集合;基于所述第一样本集合中各样本的预测损失、以及相应的第一权重确定所述第一样本集合的整体预测损失;基于所述第一样本集合的整体预测损失提升所述第一样本集中各样本的所述第一权重和所述第二权重;将所述训练集中各样本更新后的所述第二权重、以及各样本的特征和目标变量输入所述机器学习模型,以各样本的特征为粒度对所述机器学习模型进行训练。 |
地址 |
518000 广东省深圳市福田区振兴路赛格科技园2栋东403室 |