发明名称 数据搜索方法及设备
摘要 本申请公开了一种数据搜索方法及设备,以解决基于采用现有技术处理后的搜索关键词难以得到搜索结果的问题。方法包括:确定组成输入的搜索关键词的关键词单元;确定由关键词单元所组成的第一关键词单元组合;从关键词单元组合与标识的对应关系中,确定与第一关键词单元组合相匹配的关键词单元组合对应的标识;根据所述对应的标识,从所述相匹配的关键词单元组合中确定对应同一标识的关键词单元组合;并针对所述相匹配的关键词单元组合对应的每一标识,确定对应于该标识的所有关键词单元组合所包含的关键词单元组成的搜索关键词;从确定的搜索关键词中确定一个搜索关键词,并根据确定的该搜索关键词搜索数据。
申请公布号 CN102880614B 申请公布日期 2015.04.15
申请号 CN201110198243.7 申请日期 2011.07.15
申请人 阿里巴巴集团控股有限公司 发明人 常超
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种数据搜索方法,其特征在于,包括:确定组成输入的搜索关键词的关键词单元;并根据预设的关键词单元组合方式,确定由组成所述输入的搜索关键词的关键词单元所组成的第一关键词单元组合;以及从预先存储的关键词单元组合与为关键词单元组合所对应的搜索关键词分配的标识的对应关系中,确定与第一关键词单元组合相匹配的关键词单元组合,并确定所述相匹配的关键词单元组合所对应的标识,其中,为不同搜索关键词分配的标识互不相同;以及根据所述相匹配的关键词单元组合所对应的标识,从确定的所述相匹配的关键词单元组合中,确定对应于同一标识的关键词单元组合;并针对所述相匹配的关键词单元组合对应的每一标识,分别确定由确定出的对应于该标识的所有关键词单元组合所包含的关键词单元组成的搜索关键词;以及从确定的搜索关键词中确定一个搜索关键词,并根据确定的该搜索关键词搜索数据;其中,根据所述相匹配的关键词单元组合所对应的标识,从确定的所述相匹配的关键词单元组合中,确定对应于同一标识的关键词单元组合,具体包括:按照每次抽取符合指定条件的标识以及抽取出的标识遵循无放回的原则,逐个从所述相匹配的关键词单元组合所对应的标识中抽取标识;并在每次抽取出标识后,判断出相邻两次抽取出的标识相同时,记录抽取的标识所对应的关键词单元组合,直至判断出相邻两次抽取的标识不同时,从记录的关键词单元组合中确定对应于同一标识的关键词单元组合;删除记录的关键词单元组合,并记录在所述相邻两次抽取的后一次抽取中抽取到的标识对应的关键词单元组合;以及重复执行上述步骤,直至满足抽取结束条件时,从记录的关键词单元组合中确定对应于同一标识的关键词单元组合,并删除记录的关键词单元组合。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱