发明名称 |
确定搜索词权重值方法及装置、搜索结果生成方法及装置 |
摘要 |
本申请公开了一种确定搜索词权重值的方法、搜索结果生成方法及装置。一种确定搜索词权重值的方法,包括:接收用户输入的搜索请求和点击信息,生成搜索信息日志,保存入数据库;统计数据库中保存的所述搜索信息日志,生成类目分布词表;从数据库中提取属性词表,优化所述类目分布词表;根据优化后的所述类目分布词表,计算所述类目分布词表中各搜索词的权重。应用以上技术方案,在用户进行搜索时,可以更为合理的确定用户输入的搜索请求中各搜索词的重要性,减少用户的搜索时间。 |
申请公布号 |
CN102289436B |
申请公布日期 |
2013.12.25 |
申请号 |
CN201010207880.1 |
申请日期 |
2010.06.18 |
申请人 |
阿里巴巴集团控股有限公司 |
发明人 |
郭祥 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
逯长明;王宝筠 |
主权项 |
一种确定搜索词权重值的方法,其特征在于,包括以下步骤:接收输入的搜索请求和点击信息,生成搜索信息日志,保存入数据库;统计数据库中保存的所述搜索信息日志,生成类目分布词表;所述类目分布词表包括:搜索词、所述搜索词对应的搜索类目、所述搜索词对应的各搜索类目的搜索概率;从数据库中提取属性词表,优化所述类目分布词表;优化所述类目分布词表具体为:依次判断所述类目分布词表中各搜索词是否属于所述属性词表,如果是,滤除所述搜索词对应的搜索概率低于预设的第一阈值的搜索类目;如果否,将所述搜索词对应的各搜索类目的搜索概率平均化;根据优化后的所述类目分布词表中各搜索词在各搜索类目中的搜索频率,计算所述类目分布词表中各搜索词的权重值。 |
地址 |
英属开曼群岛大开曼岛资本大厦一座四层847号邮箱 |