发明名称 |
级联裂变查询方法及装置 |
摘要 |
本发明涉及一种级联裂变查询方法及装置,其中,所述方法包括根据预设语料中的每个句子所包含的词语生成每个句子的分词模式;提取预设语料中包含预设裂变词的句子,以将该句子的裂变模式加入到裂变模集合中;从所述预设语料中提取包含所述当前的裂变模集合中的裂变模式的句子,并提取该句子中裂变词位置所对应的词语,以将该词语加入到裂变词集合中;根据得到的所述裂变词集合以及所述裂变模集合进行迭代裂变搜索,以根据最终得到的裂变词集合和最终得到的裂变模集合对待查询语句进行裂变处理,并根据处理结果获取并返回查询结果。本发明提高了数据的离线挖掘效率,缩短了数据挖掘时间,进而提高了查询准确度和查询效率,提升了用户体验。 |
申请公布号 |
CN106126546A |
申请公布日期 |
2016.11.16 |
申请号 |
CN201610425914.1 |
申请日期 |
2016.06.15 |
申请人 |
北京智能管家科技有限公司 |
发明人 |
郭瑞;郭祥;李强 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种级联裂变查询方法,其特征在于,包括:根据预设语料中的每个句子所包含的词语的词性生成所述每个句子的分词模式;提取所述预设语料中包含预设裂变词的句子,并根据所述预设裂变词将所述句子的分词模式转换为裂变模式,以将该裂变模式加入到裂变模集合中;其中,所述裂变词为用于将语句划分成裂变模式的关键词;所述裂变模式为根据所述语句包含词语的词性将所述语句进行划分所得的模式;根据当前的裂变模集合,从所述预设语料中提取包含所述当前的裂变模集合中的裂变模式的句子,并提取该句子中裂变词位置所对应的词语,以将该词语加入到裂变词集合中;根据得到的所述裂变词集合以及所述裂变模集合进行迭代裂变搜索,以根据最终得到的裂变词集合和最终得到的裂变模集合对待查询语句进行裂变处理,并根据处理结果获取并返回查询结果。 |
地址 |
101500 北京市密云县经济开发区西统路8号西田各庄镇政府办公楼508室-598 |