发明名称 一种融合词向量模型和朴素贝叶斯的查询词改写方法
摘要 本发明提出一种融合词向量模型和朴素贝叶斯查询改写方法,涉及信息处理技术,该方法利用word2vec训练出向量模型并计算出与查询词最相似的前N个词构成初步的相关词库,然后进行相关度计算和分析得到对查询改写词库的候选词进行过滤,保留相关度高的词语,这种方法可有效提高查询结果的准确度和召回度,有效的解决了搜索查询无结果或者返回有效结果少的难题。
申请公布号 CN104933183A 申请公布日期 2015.09.23
申请号 CN201510385259.7 申请日期 2015.07.03
申请人 重庆邮电大学 发明人 唐贤伦;周家林;刘安静;周冲;彭永嘉;朱俊;张毅
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 重庆华科专利事务所 50123 代理人 康海燕
主权项 一种融合词向量模型和朴素贝叶斯的查询词改写方法,其特征在于,包括以下步骤:根据用户输入的当前查询词w,以及当前查询词的上下文标记contest(w),获取语料库建立词向量模型,根据词向量模型计算查询词的相关词,进行相关词筛选构成查询改写候选词库;根据用户查询日志,得到用户查询词以及搜索最终页的标题和文本标识,计算查询改写候选词库中每个候选词与查询词的相关度,根据相关度设定标准阀值,过滤器根据标准阈值过滤掉相关性弱的词,选取相关度强的词作为查询扩展词,搜索引擎根据输入的关键词对应的查询扩展词进一步搜索。
地址 400065 重庆市南岸区黄桷垭崇文路2号