发明名称 基于静态Cache的搜索方法、索引数据生成方法以及装置
摘要 本申请公开了一种基于静态Cache的搜索方法和装置、一种用于静态Cache的索引数据生成方法和装置、以及一种用于获取查询语法树标识的方法和装置。其中,基于静态Cache的搜索方法包括:接收客户端的搜索请求;根据搜索请求中的查询信息生成查询语法树;在查询语法树中查找预先生成的高频语法树,并按照从根节点到叶子节点的顺序用预先计算出的高频语法树的唯一标识替换查询信息中、与高频语法树对应的部分查询信息;所述高频语法树的唯一标识用于在检索阶段从索引库中快速召回与部分查询信息对应的搜索结果;根据替换后的查询信息对索引库进行检索,并将搜索结果返回客户端。采用上述方法,能够减少搜索引擎进行倒排召回的性能开销,提高搜索引擎的检索性能。
申请公布号 CN105335402A 申请公布日期 2016.02.17
申请号 CN201410352816.0 申请日期 2014.07.23
申请人 阿里巴巴集团控股有限公司 发明人 史可晶;罗涛
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市清华源律师事务所 11441 代理人 沈泳;李赞坚
主权项 一种基于静态Cache的搜索方法,其特征在于,包括:接收来自客户端的搜索请求;根据搜索请求中包含的查询信息,生成查询语法树;在所述查询语法树中查找是否存在预先生成的高频语法树;若存在,按照从根节点到叶子节点的顺序用预先计算出的所述高频语法树的唯一标识替换所述查询信息中的、与所述高频语法树对应的部分查询信息;所述高频语法树的唯一标识用于在检索阶段从索引库中快速召回与所述部分查询信息对应的搜索结果;根据替换后的查询信息对索引库进行检索,获取与所述搜索请求对应的搜索结果,并返回给所述客户端。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱