发明名称 |
描述型多维度事件序列的并行频繁情节挖掘方法与系统 |
摘要 |
本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计数结果小于预设阈值的事件子序列过滤,生成事件子序列集合;以待扩展情节为前缀,连接所述事件子序列集合中任一项所述事件子序列,生成新的情结,计算所述新的情结的发生,并存储到发生集合,通过递归对所述新的情结进行扩展。本发明实现了子序列之间挖掘的完全并行,即在多节点同时计算各子序列的所有情节及其发生集合,最终合并所有子序列的挖掘结果获得全局频繁情节。 |
申请公布号 |
CN106203631A |
申请公布日期 |
2016.12.07 |
申请号 |
CN201610524750.8 |
申请日期 |
2016.07.05 |
申请人 |
中国科学院计算技术研究所 |
发明人 |
敖翔;左罗;罗平;庄福振;何清 |
分类号 |
G06N5/02(2006.01)I;H04L29/06(2006.01)N |
主分类号 |
G06N5/02(2006.01)I |
代理机构 |
北京律诚同业知识产权代理有限公司 11006 |
代理人 |
祁建国;梁挥 |
主权项 |
一种描述型多维度事件序列的并行频繁情节挖掘方法,其特征在于,包括:步骤1,按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计数结果小于预设阈值的事件子序列过滤,生成事件子序列集合;步骤2,以待扩展情节为前缀,连接所述事件子序列集合中任一项所述事件子序列,生成新的情结,计算所述新的情结的发生,并存储到发生集合,通过递归对所述新的情结进行扩展。 |
地址 |
100190 北京市海淀区中关村科学院南路6号 |