发明名称 面向搜索排序的基于噪声注入主动学的样本选取方法
摘要 本发明公开一种面向搜索排序的基于噪声注入主动学的样本选取方法,对未标注样本采用噪声注入生成噪声样本,利用训练集训练出的排序模型对噪声样本进行预测,得到样本在当前排序模型下的分数分布,利用分数分布转换成排序分布,用DCG的方差度量排序分布表征不确定度,利用不确定度进行样本选样。本发明可在搜索排序问题中样本不足的条件下进行有效的选样,实现用更少的样本更有效的提升模型性能,从而达到减少样本标注代价的目的。
申请公布号 CN102446223A 申请公布日期 2012.05.09
申请号 CN201110448550.6 申请日期 2011.12.28
申请人 上海交通大学 发明人 蔡文彬;张娅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海汉声知识产权代理有限公司 31236 代理人 郭国中
主权项 一种面向搜索排序的基于噪声注入主动学习的样本选取方法,其特征在于:对未标注样本采用噪声注入生成在当前排序模型下的分数分布,利用分数分布转换成排序分布,用DCG的方差度量排序分布表征不确定性,利用不确定性进行样本选样。
地址 200240 上海市闵行区东川路800号