发明名称 |
一种类别新词的挖掘方法及装置 |
摘要 |
本发明提供了一种类别新词的挖掘方法及装置,其中所述方法包括:获取与特定类别的URL模版匹配的URL及与获取的URL对应的query;利用获取的URL及与获取的URL对应的query生成query簇;从各query簇中挖掘新词作为所述特定类别的新词。通过上述方式,可以实现类别新词的一次性挖掘,提高了新词的有效性。 |
申请公布号 |
CN103136212B |
申请公布日期 |
2016.09.07 |
申请号 |
CN201110376719.1 |
申请日期 |
2011.11.23 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
张超;王强;费晓旭 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京鸿德海业知识产权代理事务所(普通合伙) 11412 |
代理人 |
袁媛 |
主权项 |
一种类别新词的挖掘方法,其特征在于,所述方法包括:获取与特定类别的URL模版匹配的URL及与获取的URL对应的query;利用获取的URL及与获取的URL对应的query生成query簇;从各query簇中挖掘新词作为所述特定类别的新词。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |