发明名称 |
查询意图挖掘的方法和系统 |
摘要 |
本发明涉及一种查询意图挖掘的方法,包括如下步骤:获取搜索查询、识别搜索查询中的关键概念、识别关键概念中的数值类型、对于每一个识别得到的数值类型生成数值查询实例、从数据源中挖掘对应的候选意图、通过数值查询实例计算与其对应的候选意图的取值范围、对候选意图进行聚类、输出意图列表。本发明还公开了一种查询意图挖掘的系统,包括搜索查询获取模块、关键概念识别模块、数值类型识别模块、数值查询实例生成模块、候选意图挖掘模块、计算模块、聚类模块以及显示模块。采用本发明的技术方案根据搜索用户的查询意图对搜索结果进行有效的索引和组织等处理,有效地提高了准确率,避免了搜索用户筛选并非自己意图的搜索结果所造成的时间和精力的浪费。 |
申请公布号 |
CN103927328B |
申请公布日期 |
2017.04.19 |
申请号 |
CN201410101649.2 |
申请日期 |
2014.03.18 |
申请人 |
清华大学;佳能株式会社 |
发明人 |
夏云庆;那森;黄耀海;赵欢 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李迪 |
主权项 |
一种查询意图挖掘的方法,其特征在于,包括如下:A、获取一个搜索查询;B、识别该搜索查询中的关键概念;C、识别所述关键概念中的数值类型;D、对于每一个识别得到的所述数值类型,生成至少一个包含有数值查询结构的数值查询实例;E、从数据源中挖掘与所述搜索查询相关且与至少一个步骤D中生成的所述数值查询实例同时出现的候选意图;F、通过所述数值查询实例计算与其对应的所述候选意图的取值范围;G、根据步骤F中计算得出的所述候选意图的取值范围对所述候选意图进行聚类;H、输出所述候选意图的意图列表。 |
地址 |
100084 北京市海淀区清华园北京100084-82信箱 |