发明名称 |
一种同义词的挖掘方法和装置 |
摘要 |
本发明提供了一种同义词的挖掘方法和装置,其中方法包括:从搜索日志中,搜索请求(query)及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。通过本发明能够提高同义词挖掘的效率和准确性,也使挖掘出的同义词更符合搜索引擎的语言特点。 |
申请公布号 |
CN102760134A |
申请公布日期 |
2012.10.31 |
申请号 |
CN201110108976.7 |
申请日期 |
2011.04.28 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
徐文智;赵世奇;呼大为 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市威世博知识产权代理事务所(普通合伙) 44280 |
代理人 |
何青瓦;李庆波 |
主权项 |
一种同义词的挖掘方法,其特征在于,该方法包括:A、从搜索日志中,搜索请求query及其对应的搜索结果中被点击或浏览的网页标题,或者,被点击或浏览的网页标题对应的不同query,获取由短语对构成的同义词的候选资源;B、从候选资源的各短语对中抽取同义词对,其中抽取的同义词对在所属的短语对中具有相同的上下文。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |