发明名称 一种基于多示例学的检索方法及系统
摘要 本发明实施例公开了一种基于多示例学的检索方法及系统,其中,所述方法包括:获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果。通过本发明,能够使得正训练包中的示例提供的信息得到更为充分的利用,提高检索性能。
申请公布号 CN102831129B 申请公布日期 2015.03.04
申请号 CN201110171932.9 申请日期 2011.06.16
申请人 富士通株式会社 发明人 李斐;刘汝杰;于浩;石原正树;上原祐介
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 李春晖;李德山
主权项 一种基于多示例学习的检索方法,包括:获取训练包以及训练包中的训练示例,所述训练包中包括正训练包;为所述正训练包中的每一个训练示例生成权值,该权值的绝对大小代表相应的训练示例能够反映用户查询语义的程度;针对训练包以及测试包中的所有示例,利用所述正训练包中各训练示例的权值,得到各个测试示例的排序分值;根据测试包中各个测试示例的排序分值,确定各个测试包的排序分值,并根据所述测试包的排序分值确定检索结果;其中,所述为所述正训练包中的每一个训练示例生成权值包括:获知正训练包中的训练示例初始权值;根据训练示例之间的相似度,采用基于图的算法进行学习,得到各个训练示例的排序分值;确定训练包中的各个训练示例的正近邻示例集合,针对各个训练示例,根据正近邻示例集合中各训练示例的排序分值,改变正近邻示例集合中训练示例的权值,以得到正训练包中各个训练示例的最终权值;其中,所述训练示例的正近邻示例集合由正训练包中与该训练示例具有预置相似关系的训练示例组成。
地址 日本神奈川县
您可能感兴趣的专利