发明名称 一种可缺省关键词的挖掘方法、数据搜索方法及设备
摘要 本申请提出一种可缺省关键词的挖掘方法、数据搜索方法及设备,主要内容为:将包含至少两个关键词的第一查询请求对应的第一搜索结果,与包含所述至少两个关键词的子集的第二查询请求对应的第二搜索结果进行相似度计算,之后将得到的相似度值与设定的阈值进行比较,进而确定出该第一查询请求包含的关键词中可缺省的关键词,以便于在进行数据搜索时,可根据查询请求中除所述可缺省关键词外的其他关键词进行搜索,由于搜索中使用的关键词数量减少,因此,可降低搜索引擎在搜索过程中占用的时长、提高搜索效率,并减少搜索引擎对搜索过程的资源占用量;另外,减少关键词还可以搜索出更多满足用户搜索需求的搜索结果。
申请公布号 CN103116587A 申请公布日期 2013.05.22
申请号 CN201110365011.6 申请日期 2011.11.17
申请人 阿里巴巴集团控股有限公司 发明人 王跃;岳淑珍;金凯民
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种可缺省关键词的挖掘方法,其特征在于,包括:确定包含至少两个关键词的第一查询请求对应的第一搜索结果;分别确定至少一个第二查询请求对应的第二搜索结果,所述第二查询请求中的关键词为所述至少两个关键词的子集;将所述第一搜索结果分别与各第二搜索结果进行相似度运算,确定与第一搜索结果的相似度达到设定阈值的第二搜索结果;将所述第一搜索结果对应的所述至少两个关键词中,除与至少一个确定的相似度达到设定阈值的第二搜索结果对应的关键词外的关键词,作为可缺省关键词。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱