发明名称 一种基于查询语义和点击流数据的查询建议方法
摘要 本发明涉及一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理;二、对用户输入的查询数据进行分词、过滤停用词的预处理;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;四、基于知网中的词概念相关度计算方法,将用户查询数据串与查询日志库中日志信息逐条进行语义相关度计算;五、将相似度和语义相关度进行融合,计算用户查询数据串与查询日志库中每条日志信息的查询语义相关度;六、按照步骤五中的相关度由大到小,取出Top-N推荐给用户。本发明可以有效的消除查询歧义,并对输入错误进行提醒,提高信息检索系统的易用性和交互能力。
申请公布号 CN102253982A 申请公布日期 2011.11.23
申请号 CN201110172766.4 申请日期 2011.06.24
申请人 北京理工大学 发明人 彭学平;牛振东;黄胜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理,去掉非中文查询串、乱码数据及无意义的符号,形成规范的查询日志库;二、对用户输入的查询数据进行分词、过滤停用词的预处理,形成包含多个关键词的查询数据串;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;四、基于知网中的词概念相关度计算方法,将用户查询数据串与查询日志库中日志信息逐条进行语义相关度计算;五、将步骤三和步骤四计算出的相似度和语义相关度进行融合,计算用户查询数据串与查询日志库中每条日志信息的查询语义相关度;六、按照步骤五中的相关度由大到小,取出Top N推荐给用户。
地址 100081 北京市海淀区中关村南大街5号