发明名称 |
词条权重计算方法和装置 |
摘要 |
本发明提供了一种词条权重计算方法和装置,主要涉及互联网技术领域,主要目的在于合理计算搜索词中分词词条的权重。方法包括:获取共同点击同一搜索结果条目的多个搜索词,组成共同点击搜索词集合;对点击搜索结果条目的第一搜索词进行拆分,得到第一搜索词的一个或多个分词词条;根据第一搜索词的每个分词词条在共同点击搜索词集合中的出现频次,计算第一搜索词的每个分词词条的分词权重。根据本发明,收集共同点击的搜索结果条目对应的搜索词进行权重分析,可以发现出现频次较高的词条往往是搜索词的核心内容,因此可以为其赋予较高的分词权重,将该分词权重用于从搜索词中提取核心词、对搜索结果排序等都有良好效果。 |
申请公布号 |
CN105786910A |
申请公布日期 |
2016.07.20 |
申请号 |
CN201410826788.1 |
申请日期 |
2014.12.25 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
邹启波;周连强 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鼎佳达知识产权代理事务所(普通合伙) 11348 |
代理人 |
王伟锋;刘铁生 |
主权项 |
一种词条权重计算方法,其包括:获取共同点击同一搜索结果条目的多个搜索词,组成共同点击搜索词集合;对点击所述搜索结果条目的第一搜索词进行拆分,得到所述第一搜索词的一个或多个分词词条;根据所述第一搜索词的每个分词词条在所述共同点击搜索词集合中的出现频次,计算所述第一搜索词的每个分词词条的分词权重。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |