发明名称 信息检索方法和信息检索设备
摘要 本发明提供一种信息检索方法和信息检索设备。方法包括:获取用户输入的第一关键词;根据第一关键词的语义对第一关键词进行扩展,得到至少一个第二关键词,第二关键词与第一关键词具有语义重叠度;对第一关键词进行检索得到第一检索结果集合,对第二关键词进行检索得到第二检索结果集合,按照与第一关键词和/或第二关键词的语义相关度从高至低的顺序,对第一检索结果集合和第二检索结果集合中的检索结果进行重排序本发明,减缓了根据用户输入的关键词进行查询对信息检索结果的决定性影响,在用户表达检索需求的关键词比较生僻或用户输入的关键词不准确等多种情况下,提高了检索结果的稳定性,使结果与用户需求更加匹配。
申请公布号 CN102819601B 申请公布日期 2015.07.01
申请号 CN201210291308.7 申请日期 2012.08.15
申请人 中国联合网络通信集团有限公司 发明人 陈立民;徐效宁;冯立华
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 刘芳
主权项 一种信息检索方法,其特征在于,包括:获取用户输入的第一关键词;根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词,所述第二关键词与所述第一关键词具有语义重叠度;对所述第一关键词进行检索得到第一检索结果集合,对所述第二关键词进行检索得到第二检索结果集合;按照与所述第一关键词和/或所述第二关键词的语义相关度从高至低的顺序,对所述第一检索结果集合和所述第二检索结果集合中的检索结果进行重排序;所述根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词之前,还包括:根据至少一个搜索引擎的检索结果,建立语义重叠度数据库,所述语义重叠数据库中包括任一关键词与其他关键词之间的语义重叠度概率;所述根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词,包括:在所述语义重叠度数据库中,确定与所述第一关键词具有最高语义重叠度概率的至少一个所述第二关键词;根据(C|D)[l,u]=[mid(C|D)‑ξ,mid(C|D)+ξ]确定任一关键词D与任一关键词C之间的语义重叠度概率;其中,mid(C|D)=|C∩D|/|D|,为C∩D相对于D的条件概率,表示关键词D的检索结果集合中的任一检索结果,同时属于关键词C的检索结果集合的概率;ξ为非负数,表示通过任一次检索结果确定的所述关键词D与所述关键词C之间的语义重叠度概率与所述关键词D与所述关键词C之间的实际语义重叠度概率之间的误差,l和u均大于等于0,小于等于1,且l<u,l等于mid(C|D)‑ξ,u等于mid(C|D)+ξ。
地址 100033 北京市西城区金融大街21号