发明名称 一种规律挖掘和执行系统及其方法
摘要 一种金融交易复杂事件潜在风险规律挖掘和执行系统,其特征在于所述系统包括五个模块:事件识别模块;事件元素编码、量化数据离散化模块;规律提取模块;规则库及维护模块;规则匹配模块。
申请公布号 CN102012918B 申请公布日期 2012.11.21
申请号 CN201010560989.3 申请日期 2010.11.26
申请人 中金金融认证中心有限公司 发明人 王志伟;王凯玺;张鑫;张行
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京瑞思知识产权代理事务所(普通合伙) 11341 代理人 李涛
主权项 一种规律挖掘和执行系统,其特征在于所述系统包括五个模块:事件识别模块;事件元素编码、量化数据离散化模块;规律提取模块;规则库及维护模块;规则匹配模块;其中,所述规律提取模块还包括三个子模块:简单事件规律提取子模块、复杂事件规律提取子模块、习惯行为识别模块;所述事件识别模块的输入,为历史交易数据和当前执行事件,输出为输入事件的类别及其事件对象或对象集;所述事件识别模块对历史交易数据库中的事件或即将到来的事件进行定性分类,分为三类:简单事件、复杂事件、习惯事件;所述事件元素编码、量化数据离散化模块,其输入为所述事件识别模块的对象或对象集,输出为输入对应的二进制字符串;所述事件元素编码、量化数据离散化模块使用特有编码方式:基于编辑距离的差异编码;除将属性进行编码外,该模块还负责将量化的数据进行离散化,也就是对连续的属性值进行分段标记;所述简单事件规律提取子模块,通过采用基于优化的FP树的Apriori算法对风险简单事件样本学习来产生规则,针对历史交易数据库中的被标记为风险简单事件进行规律发现,其目的为发现在风险简单事件中各属性值的出现情况,即为对属性值的频繁项集挖掘;所述复杂事件规律提取子模块,针对蕴含时间逻辑的历史事件序列,发现前后事件之间的逻辑关系及属性值变化,进而挖掘规律,并经进一步编码后形成代表规则的含有通配符的规律二进制串,所述规则是规律提取后的表示形式;所述复杂事件规律提取子模块采用自动机逆向老化构建算法,能够按照自动机理论,首先利用最末事件构建自动机终点,然后向前发现自动机始点,并对事件属性进行编辑编码,进而形成事件的编码,然后通过对比前后事件相应属性位或属性位的属性值,并判断各属性的重要程度及属性值之间的涵盖程度,最终得出前后事件的逻辑关系,完成通配替换后完成对事件集的二进制编码;同时,所述复杂事件规律提取子模块还能针对某些属性位产生差异编 码,即能够逆向跟踪某属性位的属性值变化的轨迹,根据差异生成编码,历史交易数据库中将会记录最终事件;所述规则库及维护模块,执行简单事件规则库维护和复杂事件规则库维护;执行简单事件规则库维护,主要负责对在历史交易数据库中有风险的简单事件进行频繁项集挖掘后,对结果的整理和维护;执行复杂事件规则库,是对已有针对复杂事件的规则的数量求精和精度合并;随着时间的积累,规则会越来越多,数据库中记录将会越来越多,为避免规则蕴含和规则重合现象的产生,所述规则库及维护模块,在新规则存到规则库之前通过与已有规则的对比来决定新规则对规则库产生的影响和定期根据某规则被执行的情况及其误判率来修正规则库;其中,在决定新规则对规则库产生的影响时,是计算得出同类型下相应属性位之间的编辑距离,形成编辑距离集合,再依据属性位在二进制串中的位置,基于编辑距离集合生成表示新规则与已有规则差异的向量,继而计算新规则与已有规则之间的含影响系数的欧式距离;所述规则匹配模块包括三个子模块:简单事件规则匹配子模块、复杂事件规则匹配子模块、习惯行为判定模块;所述简单事件规则匹配子模块,当前事件如果被判定为简单事件,则会与规则库中简单事件规则进行对比,根据当前事件的属性值与频繁项集的匹配程度,给出风险预估;所述复杂事件规则匹配子模块,根据风险事件规则对当前事件给出风险预估;首先取滑动窗口范围内的同账户事件形成事件集,当前事件作为事件集最终事件,根据自动机逆向老化构建算法,生成当前事件对应的复杂事件的二进制编码;然后再与已有规则进行匹配,从事件编码终点开始与规则终点开始,逆向匹配已有规则;再根据本系统提出的自动机相似度距离算法,该算法通过计算二进制串对应属性位而生成差异向量,根据此向量及向量各值权重能够计算出一种二进制字符串之间的类欧式距离,所述类欧式距离是在欧氏距离基础上赋予各标量不同影响系数的欧氏距离变体,最终能够求解与已有规则的距离,进而得到阈值距离范围内的匹配规则集,该规则集为当前事件所触发规则集合,即冲突规则集。
地址 100054 北京市西城区菜市口南大街平原里20-3