发明名称 |
一种文档索引的生成方法和装置 |
摘要 |
本发明实施例提供了一种文档索引的生成方法和装置,所述方法包括:获取文档对应的一个或多个查询词锚文本;对所述查询词锚文本设置查询词锚文本总权重;按照所述查询词锚文本总权重对所述查询词锚文本包含的分词配置特征权重;基于所述特征权重确定所述分词相对于所述文档的分词权重;根据所述分词和相对于所述文档的分词权重生成文档索引。本发明实施例提高与用户搜索相关的搜索结果项的展示几率,提高了搜索的准确率,进而减少在搜索结果中翻页查找、重新输入搜索关键词等方式进行搜索,提高了操作的简便性,减少了搜索引擎和本地系统的资源的消耗,减少带宽消耗,提高了搜索效率。 |
申请公布号 |
CN105808607A |
申请公布日期 |
2016.07.27 |
申请号 |
CN201410854769.X |
申请日期 |
2014.12.31 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
董毅 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
赵娟 |
主权项 |
一种文档索引的生成方法,包括:获取文档对应的一个或多个查询词锚文本;对所述查询词锚文本设置查询词锚文本总权重;按照所述查询词锚文本总权重对所述查询词锚文本包含的分词配置特征权重;基于所述特征权重确定所述分词相对于所述文档的分词权重;根据所述分词和相对于所述文档的分词权重生成文档索引。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |