发明名称 查询语句与网页相似度的确定方法、装置、终端及服务器
摘要 本发明实施例公开了查询语句与网页相似度的确定方法、装置、终端及服务器。该方法包括:通过预先创建的短语翻译模型,将目标查询语句翻译为具有相似语义的至少一条候选语句;根据所述至少一条候选语句与网页主题句之间的相似度,确定目标查询语句和网页主题句之间的相似度;其中,所述网页主题句为网页标题,或者基于设定算法对网页内容进行解析得到的用于描述网页主要内容的语句。本实施例提供的技术方案,可以提高搜索引擎对任一查询语句的网页召回率,使得搜索引擎能够针对表现形式不同而语义相似的各条查询句,返回相差较小的网页集合,提升用户对查询结果的满意度。
申请公布号 CN104331449A 申请公布日期 2015.02.04
申请号 CN201410592231.6 申请日期 2014.10.29
申请人 百度在线网络技术(北京)有限公司 发明人 呉先超
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京品源专利代理有限公司 11332 代理人 路凯;胡彬
主权项 一种查询语句与网页相似度的确定方法,其特征在于,包括:通过预先创建的短语翻译模型,将目标查询语句翻译为具有相似语义的至少一条候选语句;根据所述至少一条候选语句与网页主题句之间的相似度,确定目标查询语句和网页主题句之间的相似度;其中,所述网页主题句为网页标题,或者基于设定算法对网页内容进行解析得到的用于描述网页主要内容的语句。
地址 100085 北京市海淀区上地十街10号百度大厦三层