发明名称 一种同义词的挖掘方法和装置
摘要 本发明提供了一种同义词的挖掘方法和装置,其中方法包括:从搜索日志中,搜索请求(query)及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。通过本发明能够提高同义词挖掘的效率和准确性,也使挖掘出的同义词更符合搜索引擎的语言特点。
申请公布号 CN102760134A 申请公布日期 2012.10.31
申请号 CN201110108976.7 申请日期 2011.04.28
申请人 北京百度网讯科技有限公司 发明人 徐文智;赵世奇;呼大为
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人 何青瓦;李庆波
主权项 一种同义词的挖掘方法,其特征在于,该方法包括:A、从搜索日志中,搜索请求query及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;B、从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。
地址 100085 北京市海淀区上地十街10号百度大厦2层
您可能感兴趣的专利