主权项 |
一种样本标签缺失数据的分类器训练方法,包括以下步骤:步骤1.数据预处理;步骤2.求解如下形式的自适应半监督学习模型:<img file="FDA0001112910720000011.GIF" wi="1374" he="110" />s.t.θ<sub>i</sub>=1,i∈Ω<sub>‑</sub>,0≤θ<sub>i</sub>≤1,i∈Ω<sub>+</sub>其中,<img file="FDA0001112910720000012.GIF" wi="173" he="63" />为训练样本,x<sub>i</sub>∈R<sup>d</sup>,y<sub>i</sub>∈{‑1,+1},负类样本点标签为“‑1”,未标记样本的标签为“+1”,Ω<sub>‑</sub>={i|y<sub>i</sub>=‑1},Ω<sub>+</sub>={i|y<sub>i</sub>=+1},<img file="FDA0001112910720000013.GIF" wi="135" he="55" />是待求解的分类函数,<img file="FDA0001112910720000014.GIF" wi="51" he="46" />是待求分类函数所属的再生核Hilbert空间,θ=[θ<sub>1</sub>,...,θ<sub>N</sub>]<sup>T</sup>∈R<sup>N</sup>是模型待求解的决策变量,L(·)是损失函数,<img file="FDA0001112910720000015.GIF" wi="102" he="55" />是关于θ的正则化函数,c<sub>1</sub>>0,c<sub>2</sub>>0,μ>0为常数;步骤3.依据训练得出的分类器f,预测未标记样本的标签。 |