发明名称 |
一种搜索方法和装置 |
摘要 |
本发明提供了一种搜索方法和装置。其中的搜索方法包括:为同一类文档设置关键属性和关键属性权重,计算各个文档的关键属性分值;建立索引倒排表;索引倒排表中的文档列表中的每条记录中均包括一个文档的文档编号和关键属性分值;所述文档列表由有序列表和无序列表组成,所述有序列表中包括n个关键属性分值最大、且按关键属性分值从大到小顺序排列的记录;其中,所述n为预先确定的值;根据用户输入的检索字符串生成相应的词源,根据所生成的词源对所述索引倒排表进行检索,并根据用户输入的搜索结果范围优先从所生成的词源对应的有序列表中获取记录,以得到所需的搜索结果和相关结果总数。应用本发明可以提高搜索速度,降低系统资源的占用。 |
申请公布号 |
CN103186650A |
申请公布日期 |
2013.07.03 |
申请号 |
CN201110461128.4 |
申请日期 |
2011.12.30 |
申请人 |
中国移动通信集团四川有限公司 |
发明人 |
简勤;郭正平;陈健骥;何丹;赖航;肖巍;郑长松;王全礼;杨俊拯 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京德琦知识产权代理有限公司 11018 |
代理人 |
王一斌;王琦 |
主权项 |
一种搜索方法,其特征在于,该方法包括:A、为同一类文档设置至少一个关键属性及相应的关键属性权重,并根据所述关键属性和关键属性权重计算各个文档的关键属性分值KFScore;B、将全部待检索文档以词源Term为关键字进行索引,建立以Term为关键字索引、以包含该Term的文档的总数TotalCount和包含该Term的文档列表DocList为值的索引倒排表;所述文档列表中的每条记录中均包括一个文档的文档编号和关键属性分值;所述文档列表由有序列表和无序列表组成,所述有序列表中包括n个关键属性分值最大、且按关键属性分值从大到小顺序排列的记录;其中,所述n为预先确定的值;C、根据用户输入的检索字符串生成相应的词源,根据所生成的词源对所述索引倒排表进行检索,并根据用户输入的搜索结果范围优先从所生成的词源对应的有序列表中获取记录,以得到所需的搜索结果和相关结果总数。 |
地址 |
610041 四川省成都市高新区高鹏大道10号 |