发明名称 |
一种基于半监督学的支持向量机分类器训练方法 |
摘要 |
本发明具体公开了一种基于半监督学的支持向量机分类器训练方法,包括如下步骤:步骤1用初始已标注样本集训练一个初始SVM分类器;步骤2从未标注样本集U中寻找分类置信度高的样本,组成高置信度样本集S;步骤3对高置信度样本集S中的每个样本,按照图3所描述的方法判断其信息量大小,如果信息量小则将其从高置信度样本集S中移除,并重新放回未标注样本集U中;步骤4将S中置信度高且信息量大的样本由机器自动标注后加入SVM分类器的已标注样本集L中;步骤5用更新的已标注样本集L重新训练SVM分类器;步骤6根据停止准则判断是退出循环还是继续迭代。 |
申请公布号 |
CN103150578A |
申请公布日期 |
2013.06.12 |
申请号 |
CN201310121254.4 |
申请日期 |
2013.04.09 |
申请人 |
山东师范大学 |
发明人 |
冷严;徐新艳 |
分类号 |
G06K9/62(2006.01)I;G06F15/18(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
济南圣达知识产权代理有限公司 37221 |
代理人 |
郑华清 |
主权项 |
一种基于半监督学习的支持向量机分类器训练方法,其特征在于:包括如下步骤:步骤1用初始已标注样本集训练一个初始SVM分类器;步骤2用SVM分类器从未标注样本集U中寻找分类置信度高的样本,组成高置信度样本集S;步骤3对高置信度样本集S中的每个样本,判断其信息量大小,如果信息量小则将其从高置信度样本集S中移除,并重新放回未标注样本集U中;步骤4将高置信度样本集S中置信度高且信息量大的样本由机器自动标注后加入SVM分类器的已标注样本集L中;步骤5用更新的已标注样本集L重新训练SVM分类器;步骤6根据停止准则判断是退出循环还是继续迭代。 |
地址 |
250014 山东省济南市历下区文化东路88号 |