发明名称 |
一种特征词关系获取方法及装置 |
摘要 |
本发明涉及数据挖掘领域,公开了一种特征词关系获取方法及装置,以解决现有技术中只能通过人工打标方式获得所有特征词对以及每对特征词之间的关联关系,从而导致人力资源大量浪费的技术问题。该方法包括:获取种子文件,种子文件中包含M个特征词对以及每对特征词之间的关联关系,M为正整数;将种子文件中的特征词对作为种子词对,基于种子词对从语料信息中提取出特征模板,特征模板中包含对应种子词对的上下文信息,N为正整数;基于特征模板获取具有关联关系的特征词对。达到了降低人力资源的浪费的技术效果。 |
申请公布号 |
CN106294476A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201510303223.X |
申请日期 |
2015.06.05 |
申请人 |
北京搜狗科技发展有限公司 |
发明人 |
商胜 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京华沛德权律师事务所 11302 |
代理人 |
马苗苗 |
主权项 |
一种特征词关系获取方法,其特征在于,包括:获取种子文件,所述种子文件中包含M个特征词对以及每对特征词之间的关联关系,M为正整数;将所述种子文件中的特征词对作为种子词对,基于所述种子词对从语料信息中提取出特征模板,所述特征模板中包含对应所述种子词对的上下文信息,N为正整数;基于所述特征模板获取具有关联关系的特征词对。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |