发明名称 基于相关性分数分布对查询意图进行分类的方法
摘要 本发明涉及网络和信息检索技术领域,公开了一种基于相关性分数分布对查询意图进行分类的方法,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数;S4、利用相关性分数的分布对查询意图进行分类。本发明采用改进的Hits算法、改进的PageRank算法以及改进的检索模型三种方式获取检索结果的相关性分数,解决了现有的方案中长尾分布的查询点击日志不足的问题,也解决了基于锚文本的方法中,无法在锚文本中找到匹配的锚文本集合或者集合中元素过少的问题。
申请公布号 CN102411626A 申请公布日期 2012.04.11
申请号 CN201110415617.6 申请日期 2011.12.13
申请人 北京大学 发明人 闫宏飞;刘晓兵;徐谷子;何靖;李铄
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种基于相关性分数分布对查询意图进行分类的方法,其特征在于,包括以下步骤:S1、获取查询的检索结果和网页;S2、根据所述检索结果和网页构建检索结果集;S3、度量所述检索结果集中文档的相关性分数;S4、利用相关性分数的分布对查询意图进行分类。
地址 100871 北京市海淀区颐和园路5号