主权项 |
一种数据搜索方法,其特征在于,包括:确定组成输入的搜索关键词的关键词单元;并根据预设的关键词单元组合方式,确定由组成所述输入的搜索关键词的关键词单元所组成的第一关键词单元组合;以及从预先存储的关键词单元组合与为关键词单元组合所对应的搜索关键词分配的标识的对应关系中,确定与第一关键词单元组合相匹配的关键词单元组合,并确定所述相匹配的关键词单元组合所对应的标识,其中,为不同搜索关键词分配的标识互不相同;以及根据所述相匹配的关键词单元组合所对应的标识,从确定的所述相匹配的关键词单元组合中,确定对应于同一标识的关键词单元组合;并针对所述相匹配的关键词单元组合对应的每一标识,分别确定由确定出的对应于该标识的所有关键词单元组合所包含的关键词单元组成的搜索关键词;以及从确定的搜索关键词中确定一个搜索关键词,并根据确定的该搜索关键词搜索数据;其中,根据所述相匹配的关键词单元组合所对应的标识,从确定的所述相匹配的关键词单元组合中,确定对应于同一标识的关键词单元组合,具体包括:按照每次抽取符合指定条件的标识以及抽取出的标识遵循无放回的原则,逐个从所述相匹配的关键词单元组合所对应的标识中抽取标识;并在每次抽取出标识后,判断出相邻两次抽取出的标识相同时,记录抽取的标识所对应的关键词单元组合,直至判断出相邻两次抽取的标识不同时,从记录的关键词单元组合中确定对应于同一标识的关键词单元组合;删除记录的关键词单元组合,并记录在所述相邻两次抽取的后一次抽取中抽取到的标识对应的关键词单元组合;以及重复执行上述步骤,直至满足抽取结束条件时,从记录的关键词单元组合中确定对应于同一标识的关键词单元组合,并删除记录的关键词单元组合。 |