发明名称 |
一种词权重的分析方法及装置 |
摘要 |
本发明公开了一种词权重的分析方法及装置,涉及互联网技术领域,解决了现有确定term权重的方法无法在互联网搜索引擎环境下准确确定query中term权重的问题。本发明的方法包括:获取<查询,标题>对;统计<查询,标题>对中所述查询的词片段中每个词的出现情况信息;根据所述出现情况信息计算相同词片段中每个词的出现概率;根据所述相同词片段中每个词的出现概率确定所述相同词片段中每个词的权重。本发明主要用于确定搜索引擎中query的term权重,提高搜索引擎的搜索质量。 |
申请公布号 |
CN105488209A |
申请公布日期 |
2016.04.13 |
申请号 |
CN201510921247.1 |
申请日期 |
2015.12.11 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
陈进平 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鼎佳达知识产权代理事务所(普通合伙) 11348 |
代理人 |
王伟锋;刘铁生 |
主权项 |
一种词权重的分析方法,其特征在于,所述方法包括:获取<查询,标题>对;统计<查询,标题>对中所述查询的词片段中每个词的出现情况信息;根据所述出现情况信息计算相同词片段中每个词的出现概率;根据所述相同词片段中每个词的出现概率确定所述相同词片段中每个词的权重。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |