发明名称 |
SVM分类器训练样本获取方法、训练方法及其系统 |
摘要 |
本发明提供一种SVM分类器训练样本获取方法、训练方法及其系统,包括:计算获取SVM分类器的各个样本的距离;根据各个所述样本的距离,对所述样本进行第一次聚类,获取至少一个第一分类,以及各个所述第一分类包含的样本;对所述样本进行第二次聚类,获取至少一个第二分类,以及各个所述第二分类包含的样本;其中,所述第二距离阈值大于所述第一距离阈值;将只包含一个样本的所述第二分类中的样本划分为孤立样本;分别在各个所述第一分类中选取一个样本作为代表样本,根据所述代表样本和所述孤立样本设置所述SVM分类器的训练样本。可以有效减少样本的数量,降低分类器的样本空间的复杂性,使分类器训练更加简单,更加有效。 |
申请公布号 |
CN104252627A |
申请公布日期 |
2014.12.31 |
申请号 |
CN201310269484.5 |
申请日期 |
2013.06.28 |
申请人 |
广州华多网络科技有限公司 |
发明人 |
苗广艺;路香菊;单霆 |
分类号 |
G06K9/66(2006.01)I |
主分类号 |
G06K9/66(2006.01)I |
代理机构 |
广州华进联合专利商标代理有限公司 44224 |
代理人 |
王茹;陈玉琼 |
主权项 |
一种SVM分类器训练样本获取方法,其特征在于,包括以下步骤:计算获取SVM分类器的各个样本相互之间的距离;将各个所述样本的距离与第一距离阈值比较,对所述样本进行第一次聚类,获取至少一个第一分类,以及各个所述第一分类包含的样本;将各个所述样本的距离与第二距离阈值比较,对所述样本进行第二次聚类,获取至少一个第二分类,以及各个所述第二分类包含的样本;其中,所述第二距离阈值大于所述第一距离阈值;当一个所述第二分类只包含一个样本,则将该样本划分为孤立样本;分别在各个所述第一分类中选取一个样本作为代表样本,根据所述代表样本和所述孤立样本设置所述SVM分类器的训练样本。 |
地址 |
510655 广东省广州市天河区黄埔大道中309号羊城创意园3-08栋 |