发明名称 |
一种基于复合词的搜索方法和搜索引擎服务器 |
摘要 |
本发明公开了一种基于复合词的搜索方法的方法,包括:对网页库保存的各网页的词语组合进行频度统计,所述词语组合由对该网页进行分词处理获得的一元词语组成;为频度大于预设阈值的词语组合建立复合词索引;所述频度大于预设阈值的词语组合为复合词;当获取搜索请求中含有与所述复合词匹配的关键词时,根据所述复合词索引返回搜索结果。相应的,本发明公开了一种搜索引擎服务器。能够通过建立复合词索引,减少对用户输入的检索语的拆分粒度,提高搜索效率,降低运算时间,从而能够较快的响应用户的搜索请求。 |
申请公布号 |
CN102200984A |
申请公布日期 |
2011.09.28 |
申请号 |
CN201010138077.7 |
申请日期 |
2010.03.24 |
申请人 |
深圳市腾讯计算机系统有限公司 |
发明人 |
刘致远 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州三环专利代理有限公司 44202 |
代理人 |
郝传鑫;潘中毅 |
主权项 |
一种基于复合词的搜索方法的方法,其特征在于,包括:对网页库保存的各网页的词语组合进行频度统计,所述词语组合由对该网页进行分词处理获得的一元词语组成;为频度大于预设阈值的词语组合建立复合词索引;所述频度大于预设阈值的词语组合为复合词;当获取搜索请求中含有与所述复合词匹配的关键词时,根据所述复合词索引返回搜索结果。 |
地址 |
518129 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼 |