发明名称 | 一种基于层次结构子话题的搜索结果多样化排序方法 | ||
摘要 | 本发明公开了一种基于层次结构子话题的搜索结果多样化排序方法,其包括如下步骤:1)定义查询词的层次结构树状子话题的表示方法;2)对层次结构子话题和查询、文档的相关性进行估算;3)建立基于查询词的层次结构子话题的搜索结果多样化模型;其中,步骤3)通过两种排序方法的任一种实现:a):根据层次结构话题新颖性模型对文档进行多样化排序;b):根据层次结构话题比例模型对文档进行多样化排序。本发明定义了查询的层次结构子话题,以及多层子话题和查询、文档间的相关性推算方法,提出基于该层次结构子话题的搜索结果多样化算法,能够灵活地利用不同粒度的子话题,更准确地匹配真实用户意图,从而提高搜索结果的多样性。 | ||
申请公布号 | CN105488195A | 申请公布日期 | 2016.04.13 |
申请号 | CN201510888616.1 | 申请日期 | 2015.12.07 |
申请人 | 中国人民大学 | 发明人 | 窦志成;文继荣;胡莎 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人 | 尹振启 |
主权项 | 一种基于层次结构子话题的搜索结果多样化排序方法,其特征在于,所述方法包括如下步骤:1)定义查询词的层次结构树状子话题的表示方法;2)对层次结构子话题和查询、文档的相关性进行估算;3)建立基于查询词的层次结构子话题的搜索结果多样化模型;其中,所述步骤3)通过两种排序方法的任一种实现:a)排序方法一:根据层次结构话题新颖性模型对文档进行多样化排序;b)排序方法二:根据层次结构话题比例模型对文档进行多样化排序。 | ||
地址 | 100872 北京市海淀区中关村大街59号 |