发明名称 基于噪声扰动的测试数据预测方法
摘要 本发明涉及一种基于噪声扰动的测试数据预测方法,包括以下步骤:S1、对测试数据进行预处理,提取测试数据的特征并进行归一化处理;S2、根据测试数据的特征建立预测模型;S3、对预测模型进行参数求解;S4、利用求解后的预测模型对测试数据进行预测;步骤S3包括:选取预测模型的损失函数、将最小化预测模型的损失函数的期望设置为目标函数、计算损失函数的变分上界、优化目标函数及使用迭代复加权最小二乘法以求解目标函数。通过采用本发明所公开的基于噪声扰动的测试数据预测方法,运用数据增广方法解决了铰链损失函数以及罗杰斯特损失函数在扰动分布下的期望很难计算的问题,为噪声扰动模型学方法提供了高效、准确的预测模型。
申请公布号 CN103942421B 申请公布日期 2017.02.15
申请号 CN201410140690.0 申请日期 2014.04.09
申请人 清华大学 发明人 陈宁;朱军;陈键飞;张钹
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 李迪
主权项 一种基于噪声扰动的测试数据预测方法,其特征在于,包括以下步骤:S1、对测试数据进行预处理,提取所述测试数据的特征并进行归一化处理;S2、根据所述测试数据的特征建立用以对测试数据进行预测的预测模型;S3、对所述预测模型进行参数求解;S4、利用求解后的所述预测模型对测试数据进行预测;其中,步骤S3包括:S3.1、选取所述预测模型的损失函数,将最小化所述预测模型的损失函数的期望设置为目标函数;S3.2、计算所述损失函数的变分上界;S3.3、基于所述损失函数的变分上界,优化所述目标函数;S3.4、使用迭代复加权最小二乘法以求解目标函数;步骤S3.1中的损失函数为铰链损失函数,所述目标函数为最小化所述预测模型的铰链损失函数的期望;铰链损失函数变分上界的公式如下:<img file="FDA0001088189960000011.GIF" wi="1624" he="88" />其中,θ:={w}表示所有需要训练学习得到的模型参数;w为预测模型权值向量;N为样本数目;λ<sub>n</sub>,n∈[N]是增广变量;q(λ)为变分分布;H(λ<sub>n</sub>)是变分分布的熵;定义<img file="FDA0001088189960000012.GIF" wi="298" he="62" />表示变分分布q的期望,<img file="FDA0001088189960000013.GIF" wi="406" he="74" />表示噪声扰动分布p的期望;<img file="FDA0001088189960000014.GIF" wi="409" he="66" />l为模型预测错误时的代价,<img file="FDA0001088189960000021.GIF" wi="45" he="52" />为经过扰动后的输入特征;<img file="FDA0001088189960000022.GIF" wi="689" he="55" />为样本n对应的响应变量的伪似然函数;c为正则化参数且取预设值;y<sub>n</sub>取值+1或‑1,表示第n个样本的类别标签;constant为常数;或步骤S3.1中的损失函数为罗杰斯特损失函数,所述目标函数为最小化所述预测模型的罗杰斯特损失函数的期望;罗杰斯特损失函数变分上界的公式如下:<img file="FDA0001088189960000023.GIF" wi="1732" he="143" />其中,N为样本数目,w为预测模型权值向量;q(λ)为变分分布;H(λ<sub>n</sub>)表示变分分布q(λ)的熵;<img file="FDA0001088189960000024.GIF" wi="299" he="62" />表示变分分布q的期望,<img file="FDA0001088189960000025.GIF" wi="405" he="74" />表示噪声扰动分布p的期望;λ<sub>n</sub>,n∈[N]是增广变量;<img file="FDA0001088189960000026.GIF" wi="790" he="79" />表示样本n对应的响应变量的伪似然函数,c为正则化因子且取预设值;y<sub>n</sub>取值+1或‑1,表示第n个样本的类别标签;<img file="FDA0001088189960000027.GIF" wi="270" he="63" /><img file="FDA0001088189960000028.GIF" wi="78" he="52" />为第n个样本经过扰动后的输入特征;constant为常数。
地址 100084 北京市海淀区清华园北京100084-82信箱