发明名称 一种基于层次结构子话题的搜索结果多样化排序方法
摘要 本发明公开了一种基于层次结构子话题的搜索结果多样化排序方法,其包括如下步骤:1)定义查询词的层次结构树状子话题的表示方法;2)对层次结构子话题和查询、文档的相关性进行估算;3)建立基于查询词的层次结构子话题的搜索结果多样化模型;其中,步骤3)通过两种排序方法的任一种实现:a):根据层次结构话题新颖性模型对文档进行多样化排序;b):根据层次结构话题比例模型对文档进行多样化排序。本发明定义了查询的层次结构子话题,以及多层子话题和查询、文档间的相关性推算方法,提出基于该层次结构子话题的搜索结果多样化算法,能够灵活地利用不同粒度的子话题,更准确地匹配真实用户意图,从而提高搜索结果的多样性。
申请公布号 CN105488195A 申请公布日期 2016.04.13
申请号 CN201510888616.1 申请日期 2015.12.07
申请人 中国人民大学 发明人 窦志成;文继荣;胡莎
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京中创阳光知识产权代理有限责任公司 11003 代理人 尹振启
主权项 一种基于层次结构子话题的搜索结果多样化排序方法,其特征在于,所述方法包括如下步骤:1)定义查询词的层次结构树状子话题的表示方法;2)对层次结构子话题和查询、文档的相关性进行估算;3)建立基于查询词的层次结构子话题的搜索结果多样化模型;其中,所述步骤3)通过两种排序方法的任一种实现:a)排序方法一:根据层次结构话题新颖性模型对文档进行多样化排序;b)排序方法二:根据层次结构话题比例模型对文档进行多样化排序。
地址 100872 北京市海淀区中关村大街59号