发明名称 |
关键词扩展方法及系统、及分类语料标注方法及系统 |
摘要 |
本发明提供一种关键词扩展方法,通过使用初始关键词进行检索,检索获得关键词作为下一次检索的基础,通过关键词迭代的方式进行检索,当前后两次检索的关键词误差在一定范围内时,将检索后的关键词作为所述初始关键词的扩展关键词,通过这种方式,获得了所述初始关键词的多种表达方式以及多方面含义的词义,将初始关键词进行了有效并合理的扩展,解决了现有技术中需要人工建立词库的问题,是一种实现方便、准确率高的关键词扩展方法。此外,还提供一种分类语料自动标注方法,为每个分类确定一个或多个初始核心关键词;通过所述初始核心关键词扩展获取每个分类的扩展关键词;利用分类对应的所述扩展关键词进行检索,从中选择分类语料,并进行标注。 |
申请公布号 |
CN104516903A |
申请公布日期 |
2015.04.15 |
申请号 |
CN201310456381.X |
申请日期 |
2013.09.29 |
申请人 |
北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
发明人 |
叶茂;汤帜;徐剑波;雷超;金立峰 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京三聚阳光知识产权代理有限公司 11250 |
代理人 |
寇海侠 |
主权项 |
一种关键词扩展方法,其特征在于,包括:根据预先给定的初始关键词进行检索,检索获得关键词;将检索获得的关键词作为下一次检索的基础,通过关键词迭代的方式进行循环检索;当一次检索得到的关键词与前一次检索得到的关键词误差在预设误差阈值内时,检索结束,将本次检索得到的关键词确定为扩展后的关键词。 |
地址 |
100871 北京市海淀区成府路298号方正大厦9层 |