发明名称 基于活动间依赖关系分析的工作流挖掘方法
摘要 本发明公开了一种基于依赖关系分析的工作流挖掘方法。从事件日志<i>L</i>中去除冗余的路径,获得目标路径集<i>L'</i>;对目标路径集<i>L'</i>中的每条路径的活动进行依赖关系<i>R</i>分析,得到动态依赖图DDG;分析动态依赖图DDG,根据活动间的依赖关系得到基于有向图的工作流模型CFG作为输出。本发明的方法能有效地识别工作流中的并发关系,从而挖掘出整体工作流模型。
申请公布号 CN103218692B 申请公布日期 2017.03.15
申请号 CN201310154278.X 申请日期 2013.04.27
申请人 南京理工大学 发明人 宋巍;张文嘉;张功萱
分类号 G06Q10/06(2012.01)I 主分类号 G06Q10/06(2012.01)I
代理机构 南京理工大学专利中心 32203 代理人 朱显国
主权项 一种基于依赖关系分析的工作流挖掘方法,其特征在于:基于事件日志的工作流挖掘,以事件日志去除冗余路径得到的目标路径集为输入,以基于有向图的工作流模型为输出结果,该方法具体包含以下步骤:(1)从事件日志L中去除冗余的路径,获得目标路径集L';(2)对目标路径集L'中的每条路径的活动进行依赖关系R分析,得到动态依赖图DDG;依赖关系R=(A<sub>i</sub>,A<sub>j</sub>),A<sub>i</sub>和A<sub>j</sub>表示活动;它包含控制依赖关系和数据依赖关系两种,在动态依赖图DDG中以有向边的形式展现;动态依赖图DDG=(N<sub>DDG</sub>,E<sub>DDG</sub>),N<sub>DDG</sub>代表动态依赖图的活动结点集,由事件日志中所有不重复的活动组成;E<sub>DDG</sub>代表结点间的依赖关系集,由分析得到的控制依赖关系集E<sub>c</sub>和数据依赖关系集E<sub>d</sub>组成;对目标路径集L'中的每条路径的活动进行依赖关系R分析,得到动态依赖图DDG的具体步骤如下:(2.1)遍历目标路径集L'中每条路径的所有活动结点,根据活动结点名称得到所有活动结点间的控制依赖关系集E<sub>c</sub>,并采用数据流分析方法,分析得到所有活动间的数据依赖关系集E<sub>d</sub>;(2.2)给所有无控制依赖的活动结点增加一个共同前驱结点Entry,添加Entry结点和无控制依赖的活动结点之间的控制依赖关系到控制依赖关系集E<sub>c</sub>中;(2.3)根据Entry结点和所有活动结点以及它们之间的依赖关系确立动态依赖图DDG的活动结点集N<sub>DDG</sub>和依赖关系集E<sub>DDG</sub>,并且根据活动结点所处选择分支的真假断言标注控制依赖关系边的真假标识,即Entry结点和While结点和他们的孩子结点之间的控制依赖关系边标注为“T”,If结点和他们的孩子结点之间的控制依赖关系边标注和真假断言相同的“T”或“F”;(3)分析动态依赖图DDG,根据活动间的依赖关系得到基于有向图的工作流模型CFG作为输出;所述步骤(3)采用全局控制流过程从动态依赖图DDG中分析得到基于有向图的工作流模型CFG,CFG=(N<sub>CFG</sub>,E<sub>CFG</sub>),N<sub>CFG</sub>代表工作流模型的结点集,E<sub>CFG</sub>代表工作流模型中结点间有向边的集;其具体包括以下步骤:(3.1)针对动态依赖图DDG中的单控制动态依赖图SC‑DDG,得到控制结点与孩子结点间的控制流关系,消除SC‑DDG的三种环;(3.2)通过连通分量算法分析得到SC‑DDG的真假分支结点集的弱连通分量WCC;(3.3)所有的弱连通分量传递约简后,不同的弱连通分量之间构成并发关系;(3.4)通过传统拓扑排序的改进算法得到每个连通分量的结点间的顺序、并发关系;(3.5)将SC‑DDG中所有边的前驱结点或后继结点不属于N<sub>SC‑DDG</sub>的改成SC‑DDG中的控制结点;(3.6)按照反层次遍历的方式重复(3.1)到(3.5),直到遍历完整个动态依赖图DDG;(3.7)根据动态依赖图DDG中的结点以及上述分析得到的它们之间的控制流关系,确立基于有向图的工作流模型CFG的结点集N<sub>CFG</sub>和边集E<sub>CFG</sub>。
地址 210094 江苏省南京市孝陵卫200号