发明名称 | 一种融合词向量模型和朴素贝叶斯的查询词改写方法 | ||
摘要 | 本发明提出一种融合词向量模型和朴素贝叶斯查询改写方法,涉及信息处理技术,该方法利用word2vec训练出向量模型并计算出与查询词最相似的前N个词构成初步的相关词库,然后进行相关度计算和分析得到对查询改写词库的候选词进行过滤,保留相关度高的词语,这种方法可有效提高查询结果的准确度和召回度,有效的解决了搜索查询无结果或者返回有效结果少的难题。 | ||
申请公布号 | CN104933183A | 申请公布日期 | 2015.09.23 |
申请号 | CN201510385259.7 | 申请日期 | 2015.07.03 |
申请人 | 重庆邮电大学 | 发明人 | 唐贤伦;周家林;刘安静;周冲;彭永嘉;朱俊;张毅 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 重庆华科专利事务所 50123 | 代理人 | 康海燕 |
主权项 | 一种融合词向量模型和朴素贝叶斯的查询词改写方法,其特征在于,包括以下步骤:根据用户输入的当前查询词w,以及当前查询词的上下文标记contest(w),获取语料库建立词向量模型,根据词向量模型计算查询词的相关词,进行相关词筛选构成查询改写候选词库;根据用户查询日志,得到用户查询词以及搜索最终页的标题和文本标识,计算查询改写候选词库中每个候选词与查询词的相关度,根据相关度设定标准阀值,过滤器根据标准阈值过滤掉相关性弱的词,选取相关度强的词作为查询扩展词,搜索引擎根据输入的关键词对应的查询扩展词进一步搜索。 | ||
地址 | 400065 重庆市南岸区黄桷垭崇文路2号 |