发明名称 |
行业词典的建立方法和装置及行业识别方法和装置 |
摘要 |
本发明实施例提供一种行业词典的建立方法和装置及行业识别方法和装置。该行业词典的建立方法包括:获取用户搜索行为日志;从用户搜索行为日志中提取各搜索词,以及对应的被点击的搜索结果;根据所述被点击的搜索结果确定搜索词所属行业,将所述搜索词作为精确索引词,建立并保存所述精确索引词和对应的行业的词条对,形成精确词典。基于用户搜索行为日志的分析可自动建立精确词典,由于被点击的搜索结果反映了用户的搜索需求,基于此确定搜索词所属行业,得到的词条对的准确率高;由于对精确索引词的对应的所有被点击的搜索结果均进行了分析,避免了某些精确索引词与行业的一对多对应关系的遗漏,提高了精确词典的词条对的准确率。 |
申请公布号 |
CN105159884A |
申请公布日期 |
2015.12.16 |
申请号 |
CN201510613993.4 |
申请日期 |
2015.09.23 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
郭涛 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京品源专利代理有限公司 11332 |
代理人 |
孟金喆;胡彬 |
主权项 |
一种行业词典的建立方法,其特征在于,包括:获取用户搜索行为日志;从所述用户搜索行为日志中提取各搜索词,以及对应的被点击的搜索结果;根据所述被点击的搜索结果确定搜索词所属行业,将所述搜索词作为精确索引词,建立并保存所述精确索引词和对应的行业的词条对,形成精确词典。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |