发明名称 |
一种可伸缩的自适应多核分类方法 |
摘要 |
一种可伸缩的自适应多核分类方法,涉及人工智能领域,特别是数据挖掘技术。预处理阶段,得到多核矩阵;建模阶段,构建一个簇相关的多核分类器;参数学阶段,在统一的框架内对分类器参数及多组多核权值参数进行优化;数据分类阶段,对待分类的样本,首先确定其属于哪一个簇,再利用学好的分类器进行数据分类。本发明通过引入中间表达“簇”挖掘复杂数据集的类间相关性和类内多样性,建立了簇相关的自适应和可伸缩多核分类器,并通过迭代的方式在统一的学框架下优化分类器参数和多组多核权值参数。面对类别繁多且特征表现复杂的数据分类问题,解决类间相关性和类内多样性带来的数据混叠问题,提高了分类准确率,且分类效果更为鲁棒。 |
申请公布号 |
CN101482926B |
申请公布日期 |
2011.06.15 |
申请号 |
CN200910077364.9 |
申请日期 |
2009.02.19 |
申请人 |
北京大学 |
发明人 |
田永鸿;杨晶晶;李远宁;段凌宇;黄铁军;高文 |
分类号 |
G06K9/62(2006.01)I;G06N1/00(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京市商泰律师事务所 11255 |
代理人 |
毛燕生 |
主权项 |
一种可伸缩的自适应多核分类方法,其特征在于,该方法包括以下步骤:1)预处理阶段:利用样本的特征对所有训练样本进行无监督聚类,将相关性强的样本聚到同一个簇中,并计算训练集中所有样本对的多个核函数值,得到多核矩阵;2)建模阶段:构建簇相关的自适应多核分类器模型;3)学习阶段:对多核分类器的参数及多组多核权值参数进行优化;4)数据分类阶段:利用学习好的多核分类器对待分类的样本进行数据分类。 |
地址 |
100871 北京市海淀区中关村颐和园路5号 |