发明名称 索引建立方法、搜索方法和搜索结果排序方法及对应装置
摘要 本发明提供了一种索引建立方法、搜索方法和搜索结果排序方法及对应装置,其中建立索引的方法包括:对页面进行分词和词性标注;基于语义分析或页面中的视觉特征中的至少一种,从分词处理后得到的各词语中确定实体词以及该实体词对应的属性词并分别进行标注;在建立所述页面的索引时,将建立索引所使用词语具有的实体词或属性词标注同时添加入索引中。在对query进行搜索时同时匹配词语的实体词或属性词标注,或者在对query的搜索结果进行排序时,提高与query中各词语及各词语的实体词或属性词标注相匹配的索引对应的页面的排序权值。通过本发明能够提高搜索准确性,改善搜索效果。
申请公布号 CN102737039B 申请公布日期 2014.11.12
申请号 CN201110086824.1 申请日期 2011.04.07
申请人 北京百度网讯科技有限公司 发明人 喻宏勇;石远
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人 袁媛
主权项 一种索引建立方法,其特征在于,该方法包括:A、对页面进行分词和词性标注;B、基于语义分析或页面中的视觉特征中的至少一种,从分词处理后得到的各词语中确定实体词以及该实体词对应的属性词并分别进行标注;C、在建立所述页面的索引时,将建立索引所使用词语具有的实体词或属性词标注同时添加入索引中,添加入所述索引中的还包括以下标注中的至少一种:实体词与属性词之间对应关系的标注;属性词的属性类型标注;实体词具有突出的视觉特征标注;以及,属性词具有突出的视觉特征标注;所述页面的索引中的标注用于在进行页面搜索时保证从query中分析出的实体词或属性词与所述索引中的标注匹配,或者在进行搜索结果的排序时,对从query中分析出的实体词或属性词与所述索引中的标注匹配的页面提高在搜索结果中的排序权值。
地址 100085 北京市海淀区上地十街10号百度大厦2层