发明名称 | 一种基于非负矩阵分解的事件分析方法与系统 | ||
摘要 | 本发明提供一种基于非负矩阵分解的事件分析方法与系统,该方法包括:获取包括至少一个数据文本的待处理数据;分别对每个数据文本进行分词处理,得到与待处理数据对应的文本空间矩阵;对文本空间矩阵进行非负矩阵分解,根据分解得到的基矩阵确定待处理数据中包含的各个事件以及分别用于描述各个事件的关键词,并根据分解得到的系数矩阵确定分别与各个事件对应的数据文本。通过构造待处理数据的文本空间矩阵,并对该文本空间矩阵进行非负矩阵分解,从而将一个规模庞大的矩阵分解成为两个规模较小的矩阵,并且保证分解前后矩阵元素的非负性,在保证事件挖掘结果的准确性的同时,通过降维找到待处理数据中包含的事件,计算简便,可扩展性较好。 | ||
申请公布号 | CN104281663A | 申请公布日期 | 2015.01.14 |
申请号 | CN201410495959.7 | 申请日期 | 2014.09.24 |
申请人 | 北京航空航天大学 | 发明人 | 张日崇;邰振赢;于伟仁;刘俊伟;李建欣 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京同立钧成知识产权代理有限公司 11205 | 代理人 | 刘芳 |
主权项 | 一种基于非负矩阵分解的事件分析方法,其特征在于,包括:获取待处理数据,所述待处理数据中包括至少一个数据文本;分别对所述至少一个数据文本中的每个数据文本进行分词处理,得到与所述待处理数据对应的文本空间矩阵,所述文本空间矩阵描述了所述至少一个数据文本中所包含的词语信息;对所述文本空间矩阵进行非负矩阵分解,根据分解得到的基矩阵确定所述待处理数据中包含的各个事件以及分别用于描述所述各个事件的关键词,并根据分解得到的系数矩阵确定分别与所述各个事件对应的数据文本。 | ||
地址 | 100191 北京市海淀区学院路37号 |