发明名称 |
索引建立方法、搜索方法和搜索结果排序方法及对应装置 |
摘要 |
本发明提供了一种索引建立方法、搜索方法和搜索结果排序方法及对应装置,其中建立索引的方法包括:对页面进行分词和词性标注;基于语义分析或页面中的视觉特征中的至少一种,从分词处理后得到的各词语中确定实体词以及该实体词对应的属性词并分别进行标注;在建立所述页面的索引时,将建立索引所使用词语具有的实体词或属性词标注同时添加入索引中。在对query进行搜索时同时匹配词语的实体词或属性词标注,或者在对query的搜索结果进行排序时,提高与query中各词语及各词语的实体词或属性词标注相匹配的索引对应的页面的排序权值。通过本发明能够提高搜索准确性,改善搜索效果。 |
申请公布号 |
CN102737039A |
申请公布日期 |
2012.10.17 |
申请号 |
CN201110086824.1 |
申请日期 |
2011.04.07 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
喻宏勇;石远 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市威世博知识产权代理事务所(普通合伙) 44280 |
代理人 |
何青瓦;李庆波 |
主权项 |
一种索引建立方法,其特征在于,该方法包括:A、对页面进行分词和词性标注;B、基于语义分析或页面中的视觉特征中的至少一种,从分词处理后得到的各词语中确定实体词以及该实体词对应的属性词并分别进行标注;C、在建立所述页面的索引时,将建立索引所使用词语具有的实体词或属性词标注同时添加入索引中。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |