发明名称 基于大规模数据的自适应参数的多核学分类方法
摘要 本发明公开了一种基于大规模数据的自适应参数的多核学分类方法,包括以下步骤:选定多核学的核函数;载入数据集,将数据集随机分为训练数据集和测试数据集;将训练数据集的单独一维特征值和每一维特征值进行混合,得到核矩阵组;将单位矩阵增加至核矩阵组的第一项构成新的核矩阵组,求解新的核矩阵组的权重参数组,权重参数组的第一项为正则化惩罚因子参数C的倒数,其余项为各个基核的权重参数;通过计算半无限线性规划问题得出分类模型;将测试数据集通过分类模型得到分类结果。本发明将多核学问题转化为半正定线性规划优化问题,解决了大规模数据问题;能够自适应学C参数,提高了求解效率,避免了繁琐交叉验证过程。
申请公布号 CN103678681B 申请公布日期 2017.03.01
申请号 CN201310728811.9 申请日期 2013.12.25
申请人 中国科学院深圳先进技术研究院 发明人 郭宁;冯良炳
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市铭粤知识产权代理有限公司 44304 代理人 杨林;马翠平
主权项 一种基于大规模数据的自适应参数的多核学习分类方法,其特征在于,所述方法包括以下步骤:S1、选定多核学习的核函数;S2、载入数据集,并进行归一化处理,将数据集随机分为训练数据集和测试数据集,其中测试数据集相应的分类标签作为标准分类标签;S3、将训练数据集的单独一维特征值和每一维特征值进行混合,得到核矩阵组,作为构造多核学习目标函数的特征值;S4、将单位矩阵增加至核矩阵组的第一项构成新的核矩阵组,求解新的核矩阵组的权重参数组,权重参数组的第一项为正则化惩罚因子参数C的倒数,其余项为各个基核的权重参数;S5、通过计算半无限线性规划问题得出分类模型;S6、将测试数据集通过分类模型得到分类结果,即分类标签。
地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号