发明名称 | 基于相关性分数分布对查询意图进行分类的方法 | ||
摘要 | 本发明涉及网络和信息检索技术领域,公开了一种基于相关性分数分布对查询意图进行分类的方法,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数;S4、利用相关性分数的分布对查询意图进行分类。本发明采用改进的Hits算法、改进的PageRank算法以及改进的检索模型三种方式获取检索结果的相关性分数,解决了现有的方案中长尾分布的查询点击日志不足的问题,也解决了基于锚文本的方法中,无法在锚文本中找到匹配的锚文本集合或者集合中元素过少的问题。 | ||
申请公布号 | CN102411626A | 申请公布日期 | 2012.04.11 |
申请号 | CN201110415617.6 | 申请日期 | 2011.12.13 |
申请人 | 北京大学 | 发明人 | 闫宏飞;刘晓兵;徐谷子;何靖;李铄 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京路浩知识产权代理有限公司 11002 | 代理人 | 王莹 |
主权项 | 一种基于相关性分数分布对查询意图进行分类的方法,其特征在于,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数;S4、利用相关性分数的分布对查询意图进行分类。 | ||
地址 | 100871 北京市海淀区颐和园路5号 |