发明名称 一种搜索意图识别方法及装置
摘要 本申请公开了一种搜索意图识别方法及装置,其通过获取历史搜索记录中的海量历史搜索语句并对其进行分类,并依此建立分类模型,通过该分类模型挖掘得到与各历史搜索语句相关的候补搜索语句,以同一预设专项类别对应的历史搜索语句及其候补搜索语句来构成该预设专项类别的专项搜索词库;相对于现有技术人工设置的白名单、模糊查询阈值、模式匹配关键词等,所述专项搜索词库中的搜索语句更准确、更全面,泛化性强,因此,本申请依据该专项搜索词库进行搜索意图识别,可以更准确地识别目标搜索语句的意图类别,避免人工指定规则与用户实际判断标准不一致造成的错误识别。
申请公布号 CN105095187A 申请公布日期 2015.11.25
申请号 CN201510486646.X 申请日期 2015.08.07
申请人 广州神马移动信息科技有限公司 发明人 康昭委;李亚楠;曾洪雷
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京弘权知识产权代理事务所(普通合伙) 11363 代理人 逯长明;许伟群
主权项 一种搜索意图识别方法,其特征在于,包括:获得第一预设时间内的第一历史搜索语句集合,对所述第一历史搜索语句集合中的历史搜索语句进行分类,得到各个预设专项类别对应的专项搜索词库;根据所述专项搜索词库建立分类模型,并通过所述分类模型获取各个预设专项类别对应的候补搜索语句,将所述候补搜索语句记入相应类别的专项搜索词库;根据所述专项搜索词库确定至少一个预设专项类别,作为目标搜索语句的意图类别。
地址 510627 广东省广州市天河区黄埔大道西平云路163号广电平云广场B塔12层自编01单元