发明名称 一种类别新词的挖掘方法及装置
摘要 本发明提供了一种类别新词的挖掘方法及装置,其中所述方法包括:获取与特定类别的URL模版匹配的URL及与获取的URL对应的query;利用获取的URL及与获取的URL对应的query生成query簇;从各query簇中挖掘新词作为所述特定类别的新词。通过上述方式,可以实现类别新词的一次性挖掘,提高了新词的有效性。
申请公布号 CN103136212B 申请公布日期 2016.09.07
申请号 CN201110376719.1 申请日期 2011.11.23
申请人 北京百度网讯科技有限公司 发明人 张超;王强;费晓旭
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鸿德海业知识产权代理事务所(普通合伙) 11412 代理人 袁媛
主权项 一种类别新词的挖掘方法,其特征在于,所述方法包括:获取与特定类别的URL模版匹配的URL及与获取的URL对应的query;利用获取的URL及与获取的URL对应的query生成query簇;从各query簇中挖掘新词作为所述特定类别的新词。
地址 100085 北京市海淀区上地十街10号百度大厦2层