发明名称 强变量提取方法及装置
摘要 本发明公开了一种强变量提取方法及装置;方法包括:基于基础变量池中的基础变量构造强变量,形成用于第k轮迭代训练的强变量候选集;基于所述强变量候选集对特征筛选模型进行第k轮迭代训练,k为取值依次增大的正整数,且k取值满足k≥1;将所述特征筛选模型输出的特征并入到入选特征集合,所述输出的特征为对所述特征筛选模型进行第k轮迭代训练后在所述强变量候选集中提取的强变量;基于第k轮迭代训练后所述特征筛选模型的残差确定需要对所述特征筛选模型进行第k+1轮迭代训练;筛除所述基础变量池中用于构造所述入选特征集合中的特征所使用的基础变量。实施本发明,能够从弱变量中有效提取强变量。
申请公布号 CN106095942A 申请公布日期 2016.11.09
申请号 CN201610416751.0 申请日期 2016.06.12
申请人 腾讯科技(深圳)有限公司 发明人 刘志斌;陈培炫;陈谦
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京派特恩知识产权代理有限公司 11270 代理人 张振伟;张颖玲
主权项 一种强变量提取方法,其特征在于,所述方法包括:基于基础变量池中的基础变量构造强变量,形成用于第k轮迭代训练的强变量候选集;基于所述强变量候选集对特征筛选模型进行第k轮迭代训练,k为取值依次增大的正整数,且k取值满足k≥1;将所述特征筛选模型输出的特征并入到入选特征集合,所述输出的特征为对所述特征筛选模型进行第k轮迭代训练后所述特征筛选模型在所述强变量候选集中提取的强变量;基于第k轮迭代训练后所述特征筛选模型的残差确定需要对所述特征筛选模型进行第k+1轮迭代训练;筛除所述基础变量池中用于构造所述入选特征集合中的特征所使用的基础变量。
地址 518000 广东省深圳市福田区振兴路赛格科技园2栋东403室