发明名称 一种安全的半监督学方法
摘要 本发明公开一种安全的半监督学方法,包括构建多个半监督分类器步骤和构建最终安全半监督分类器步骤;首先对于给定训练数据集构建多个差异性大的半监督分类器;然后通过最坏情况下最大化性能提高来构建最终安全半监督分类器。本发明的方法在实施过程中很少导致性能下降,与此同时取得了与现有经典技术高度可比的性能。
申请公布号 CN103390171A 申请公布日期 2013.11.13
申请号 CN201310315501.4 申请日期 2013.07.24
申请人 南京大学 发明人 周志华;李宇峰
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 李玉平
主权项 一种安全的半监督学习方法,其特征在于,包括构建多个半监督分类器步骤和构建最终的安全半监督分类器步骤;所述构建多个半监督分类器步骤具体为:步骤100,对于少量有标记数据和大量未标记数据,随机初始化多个半监督分类器;步骤101,对于每个初始半监督分类器,根据半监督分类器的目标函数,通过优化方法对半监督分类器的预测结果进行优化;步骤102,将优化过的半监督分类器的预测结果通过机器学习的聚类方法分成多个簇;步骤103,对于聚类结果的每个簇,输出其中目标值最优的半监督分类器;步骤104,收集每个簇输出的半监督分类器,得到多个半监督分类器;所述构建最终的安全半监督分类器步骤具体为:步骤200,对少量有标记数据训练监督学习方法,得到未标记数据上的预测结果;步骤201,假定步骤104构建的每个半监督分类器为真实分类器,根据监督学习方法的预测结果,对任意未标记数据上的预测结果定义性能提高函数;步骤202,对任意未标记数据上的预测结果,对步骤201得到的多个性能提高函数,考察最小的性能提高定义为最坏情况下的性能提高函数;步骤203,根据最坏情况下的性能提高目标函数,通过优化方法对未标记数据的预测结果进行优化,使其最大化最坏情况下的性能提高目标函数;步骤204,将优化结果输出,作为最终的安全半监督分类器的预测结果。
地址 210093 江苏省南京市鼓楼区汉口路22号