发明名称 | 一种基于知识库的查询分面生成方法 | ||
摘要 | 本发明公开了一种基于知识库的查询分面生成方法,该方法包括如下步骤:1)对于给定查询q,从搜索引擎中获取前T个检索结果,组成查询结果集合D;2)基于QDMiner算法获取一系列初始查询分面f,一系列所述初始查询分面f组成集合F;3)对每一个所述初始查询分面f进行扩展;4)对扩展后的所述初始查询分面f利用检索文档进行过滤,以保证扩展结果的准确率;利用扩展之后的初始查询分面f生成最终的查询分面。本发明使用知识库生成查询分面,可以有效解决现有方法依赖于检索结果的局限性。通过利用知识库中高质量的信息对初始分面进行扩展,检索结果中没有出现或未被抽取的分面词项可以被准确定位,从而提高查询分面的准确性和覆盖率。 | ||
申请公布号 | CN105550226A | 申请公布日期 | 2016.05.04 |
申请号 | CN201510888652.8 | 申请日期 | 2015.12.07 |
申请人 | 中国人民大学 | 发明人 | 窦志成;文继荣;江政宝 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人 | 尹振启 |
主权项 | 一种基于知识库的查询分面生成方法,其特征在于,所述方法包括如下步骤:1)对于给定查询q,从搜索引擎中获取前T个检索结果,组成查询结果集合D;2)基于QDMiner算法获取一系列初始查询分面f,一系列所述初始查询分面f组成集合F;3)对每一个所述初始查询分面f进行扩展;4)对扩展后的所述初始查询分面f利用检索文档进行过滤,以保证扩展结果的准确率;利用扩展之后的初始查询分面f生成最终的查询分面。 | ||
地址 | 100872 北京市海淀区中关村大街59号 |