主权项 |
一种信息检索方法,其特征在于,包括:获取用户输入的第一关键词;根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词,所述第二关键词与所述第一关键词具有语义重叠度;对所述第一关键词进行检索得到第一检索结果集合,对所述第二关键词进行检索得到第二检索结果集合;按照与所述第一关键词和/或所述第二关键词的语义相关度从高至低的顺序,对所述第一检索结果集合和所述第二检索结果集合中的检索结果进行重排序;所述根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词之前,还包括:根据至少一个搜索引擎的检索结果,建立语义重叠度数据库,所述语义重叠数据库中包括任一关键词与其他关键词之间的语义重叠度概率;所述根据所述第一关键词的语义对所述第一关键词进行扩展,得到至少一个第二关键词,包括:在所述语义重叠度数据库中,确定与所述第一关键词具有最高语义重叠度概率的至少一个所述第二关键词;根据(C|D)[l,u]=[mid(C|D)‑ξ,mid(C|D)+ξ]确定任一关键词D与任一关键词C之间的语义重叠度概率;其中,mid(C|D)=|C∩D|/|D|,为C∩D相对于D的条件概率,表示关键词D的检索结果集合中的任一检索结果,同时属于关键词C的检索结果集合的概率;ξ为非负数,表示通过任一次检索结果确定的所述关键词D与所述关键词C之间的语义重叠度概率与所述关键词D与所述关键词C之间的实际语义重叠度概率之间的误差,l和u均大于等于0,小于等于1,且l<u,l等于mid(C|D)‑ξ,u等于mid(C|D)+ξ。 |