发明名称 对无结果词进行标签识别的搜索方法和系统
摘要 本发明公开了一种对无结果词进行标签识别的搜索方法和系统,从用户搜索词出发,分析用户真正的搜索意图,通过外网相关数据的爬取,再对爬取结果进行数据挖掘提取出与该词相关度较高的关键词即高频词,同时结合常用语料库对高频词进行归类。本发明扩大了关联数据的爬取范围,克服了普通无结果处理方法中主要局限于对站内搜索数据及用户行为的挖掘,容易出现处理失败的缺陷。
申请公布号 CN105989125A 申请公布日期 2016.10.05
申请号 CN201510082637.4 申请日期 2015.02.16
申请人 苏宁云商集团股份有限公司 发明人 贾洪园;张晶
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 江苏圣典律师事务所 32237 代理人 许峰
主权项 一种对无结果词进行标签识别的搜索方法,其特征在于,该方法包括以下步骤:(1)对于无结果词,基于外网数据的爬取和分词切分,提取出高频词并对其进行标注;(2)在标注的高频词基础上生成替换词;(3)对无结果词进行扩展,如得到的扩展词中包括替换词,则进一步,对该替换词进行前台搜索,如果有检索结果,则将前台搜索的结果作为最终搜索结果输出。
地址 210042 江苏省南京市玄武区苏宁大道1号苏宁总部