发明名称 一种基于复合词的搜索方法和搜索引擎服务器
摘要 本发明公开了一种基于复合词的搜索方法的方法,包括:对网页库保存的各网页的词语组合进行频度统计,所述词语组合由对该网页进行分词处理获得的一元词语组成;为频度大于预设阈值的词语组合建立复合词索引;所述频度大于预设阈值的词语组合为复合词;当获取搜索请求中含有与所述复合词匹配的关键词时,根据所述复合词索引返回搜索结果。相应的,本发明公开了一种搜索引擎服务器。能够通过建立复合词索引,减少对用户输入的检索语的拆分粒度,提高搜索效率,降低运算时间,从而能够较快的响应用户的搜索请求。
申请公布号 CN102200984A 申请公布日期 2011.09.28
申请号 CN201010138077.7 申请日期 2010.03.24
申请人 深圳市腾讯计算机系统有限公司 发明人 刘致远
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州三环专利代理有限公司 44202 代理人 郝传鑫;潘中毅
主权项 一种基于复合词的搜索方法的方法,其特征在于,包括:对网页库保存的各网页的词语组合进行频度统计,所述词语组合由对该网页进行分词处理获得的一元词语组成;为频度大于预设阈值的词语组合建立复合词索引;所述频度大于预设阈值的词语组合为复合词;当获取搜索请求中含有与所述复合词匹配的关键词时,根据所述复合词索引返回搜索结果。
地址 518129 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼