发明名称 一种搜索方法和系统
摘要 本申请提供了一种搜索方法和系统,涉及网络技术领域。本申请首先利用第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段,然后基于目标对象的新字段构建索引;在构建完成索引后,对于用户的搜索词可基于该索引和第一分隔符计算根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度,然后基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。本申请将商品的标题和品牌信息,利用分隔符拼装成新字段,然后对此新字段进行搜索引擎索引构建,通过本申请可快速返回符合用户的期望的商品结果,并且只需要增量更新一遍索引,在计算文本相关性时,可以一次运算完成,这大大减少计算成本和硬件资源。
申请公布号 CN103218364B 申请公布日期 2016.05.04
申请号 CN201210018149.3 申请日期 2012.01.19
申请人 阿里巴巴集团控股有限公司 发明人 李嘉森
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种搜索方法,其特征在于,包括:对于用户输入的搜索词,获取所述搜索词对应的各查询词;针对得到的各查询词,在索引中搜索与各查询词相应的各索引词,所述索引根据目标对象的字段构建,所述目标对象的字段包括通过第一分隔符将目标对象的标题信息字段区和属性信息字段区拼接成的新字段;依据各索引词在所属新字段中的位置和所述新字段中第一分隔符的位置,确认索引词对应的查询词在所属新字段中是属于标题信息字段区还是属于属性信息字段区;根据所述新字段的各查询词所在所属字段区计算搜索词与该新字段的总相关度;所述总相关度包括依据所述新字段的各查询词所在所属字段区的权重计算的第一相关度;基于各新字段与搜索词的总相关度,返回至少一个新字段对应的目标对象。
地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱