发明名称 |
事件的识别方法和装置 |
摘要 |
本发明公开了一种事件的识别方法和装置。其中,该方法包括:对文本信息进行分词处理得到第一词语和多个第二词语;获取第一词语对应文本信息的第一多维数组和各个第二词语对应文本信息的第二多维数组;使用第一多维数组和各个第二多维数组计算第一词语与各个第二词语的第一关联度数据;按照第一关联度数据提取第二词语,得到第一关联词集合;计算该集合中的各个第三词语与第二词语的集合中的第四词语的第二关联度数据;将符合第二预设条件的第二关联度数据对应的第四词语作为第五词语,得到第一词语的事件词组。通过本发明,解决了现有技术中识别关键词的关联事件的速度慢、准确性差的问题,实现了提高识别关联事件的速度和准确性的效果。 |
申请公布号 |
CN104462439A |
申请公布日期 |
2015.03.25 |
申请号 |
CN201410779142.2 |
申请日期 |
2014.12.15 |
申请人 |
北京国双科技有限公司 |
发明人 |
刘粉香 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 11240 |
代理人 |
吴贵明;张永明 |
主权项 |
一种事件的识别方法,其特征在于,包括:对预先获取的文本信息进行分词处理得到第一词语和多个第二词语;通过机器学习方法获取所述第一词语对应所述文本信息的第一多维数组和各个所述第二词语对应所述文本信息的第二多维数组;使用所述第一多维数组和各个所述第二多维数组计算所述第一词语与各个所述第二词语的第一关联度数据;提取符合第一预设条件的所述第一关联度数据对应的第二词语,得到第一关联词集合;计算所述第一关联词集合中的各个第三词语与所述第二词语的集合中的第四词语的第二关联度数据,其中,所述第二词语的集合包括所述第三词语和所述第四词语;将符合第二预设条件的所述第二关联度数据对应的所述第四词语作为第五词语;保存具有关联关系的所述第三词语、所述第五词语以及所述第一词语,得到所述第一词语的事件词组。 |
地址 |
100086 北京市海淀区双榆树小区知春路76号翠宫饭店8层A间 |