发明名称 描述型多维度事件序列的并行频繁情节挖掘方法与系统
摘要 本发明提出描述型多维度事件序列的并行频繁情节挖掘方法与系统,涉及互联网技术领域,该方法包括按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计数结果小于预设阈值的事件子序列过滤,生成事件子序列集合;以待扩展情节为前缀,连接所述事件子序列集合中任一项所述事件子序列,生成新的情结,计算所述新的情结的发生,并存储到发生集合,通过递归对所述新的情结进行扩展。本发明实现了子序列之间挖掘的完全并行,即在多节点同时计算各子序列的所有情节及其发生集合,最终合并所有子序列的挖掘结果获得全局频繁情节。
申请公布号 CN106203631A 申请公布日期 2016.12.07
申请号 CN201610524750.8 申请日期 2016.07.05
申请人 中国科学院计算技术研究所 发明人 敖翔;左罗;罗平;庄福振;何清
分类号 G06N5/02(2006.01)I;H04L29/06(2006.01)N 主分类号 G06N5/02(2006.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 祁建国;梁挥
主权项 一种描述型多维度事件序列的并行频繁情节挖掘方法,其特征在于,包括:步骤1,按照事件属性将所述事件序列分为多个事件子序列,对每个事件子序列进行挖掘,并将挖掘结果进行存储,将相同的事件子序列进行计数累加,将计数结果小于预设阈值的事件子序列过滤,生成事件子序列集合;步骤2,以待扩展情节为前缀,连接所述事件子序列集合中任一项所述事件子序列,生成新的情结,计算所述新的情结的发生,并存储到发生集合,通过递归对所述新的情结进行扩展。
地址 100190 北京市海淀区中关村科学院南路6号
您可能感兴趣的专利