发明名称 一种基于加权的多种群粒子群优化的危险源原因分析方法
摘要 本发明提供了一种基于加权的多种群粒子群优化的危险源原因分析方法,本发明将危险源的原因分析看做一个关联规则挖掘的过程。在数据预处理阶段引入项目权重的概念,重新定义了项目集范围的概念。在关联规则挖掘的过程中,提出了基于加权的多种群粒子群优化的关联规则挖掘算法,算法在多种群协作的粒子群优化的基础上引入种群间通信机制,增加了种群多样性且避免了算法容易陷入局部最优解的缺点。同时,引入粒子权重的概念,使得算法能够选择出对用户更有意义的规则。从而提高了危险源原因分析的准确性与效率,扩大了危险源原因分析的分析范围,降低了危险源原因分析的复杂度。
申请公布号 CN106600100A 申请公布日期 2017.04.26
申请号 CN201610940992.5 申请日期 2016.11.01
申请人 南京航空航天大学 发明人 周良;李诗瑶;谢强;郑洪源
分类号 G06Q10/06(2012.01)I;G06Q10/04(2012.01)I;G06Q50/26(2012.01)I;G06N3/00(2006.01)I 主分类号 G06Q10/06(2012.01)I
代理机构 南京瑞弘专利商标事务所(普通合伙) 32249 代理人 唐绍焜
主权项 一种基于加权的多种群粒子群优化的危险源原因分析方法,其特征在于:包括步骤:(1)利用人工的方法或根据已有的算法对危险源各项目分配权重;设定危险源项目集I和危险源事务数据库D;将危险源事务数据库的每一个危险源事务用二进制表示;(2)定义加权的项目集范围:<maths num="0001"><math><![CDATA[<mrow><mi>W</mi><mi>R</mi><mi>I</mi><mrow><mo>(</mo><mi>m</mi><mo>&RightArrow;</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mo>&lsqb;</mo><mi>l</mi><mi>o</mi><mi>g</mi><mrow><mo>(</mo><mi>n</mi><mi>W</mi><mi>I</mi><mo>(</mo><mi>m</mi><mo>)</mo><mi>T</mi><mi>r</mi><mi>a</mi><mi>n</mi><mo>(</mo><mi>m</mi><mo>)</mo><mo>)</mo></mrow><mo>+</mo><mi>l</mi><mi>o</mi><mi>g</mi><mrow><mo>(</mo><mi>n</mi><mi>W</mi><mi>I</mi><mo>(</mo><mi>n</mi><mo>)</mo><mi>T</mi><mi>r</mi><mi>a</mi><mi>n</mi><mo>(</mo><mi>n</mi><mo>)</mo><mo>)</mo></mrow><mo>&rsqb;</mo><mfrac><mrow><mi>W</mi><mi>T</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>n</mi><mo>)</mo></mrow><mo>-</mo><mi>T</mi><mi>r</mi><mi>a</mi><mi>n</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>n</mi><mo>)</mo></mrow></mrow><mrow><mi>&Sigma;</mi><mi>W</mi><mi>T</mi><mrow><mo>(</mo><mi>T</mi><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0001139109760000011.GIF" wi="1701" he="141" /></maths>其中,m≠n并且m<n,m和n分别表示项目集的长度,即项目集中所包含项目的数量;WI(m)和WI(n)表示项目集的权重,Tran(m)和Tran(n)表示包含相应项目集的事务数量,WT(m,n)和Tran(m,n)分别代表包含m和n且满足m→n的事务的权重和数量,ΣWT(T)表示所有事务的权重之和;<img file="FDA0001139109760000012.GIF" wi="426" he="197" />式中,I(j)表示事务T中第j个项目,|T|表示事务中项目的数量;(3)根据步骤(2)计算得到最大的WRI对应的m和n分别作为关联规则的前分区点和后分区点,对关联规则编码,生成危险源的候选关联规则集R={R<sub>1</sub>,…,R<sub>m</sub>};将关联规则作为粒子群的粒子,并确定适应度函数:<maths num="0002"><math><![CDATA[<mrow><mi>W</mi><mi>C</mi><mi>o</mi><mi>m</mi><mi>p</mi><mi>r</mi><mi>e</mi><mi>h</mi><mi>e</mi><mi>n</mi><mi>e</mi><mi>s</mi><mi>s</mi><mo>=</mo><msub><mi>N</mi><mn>1</mn></msub><mo>&times;</mo><mfrac><mrow><mi>W</mi><mi>S</mi><mi>P</mi><mi>I</mi><mrow><mo>(</mo><mi>A</mi><mo>&cup;</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mo>|</mo><mi>N</mi><mo>|</mo></mrow></mfrac><mo>+</mo><msub><mi>N</mi><mi>2</mi></msub><mo>&times;</mo><mfrac><mrow><mi>W</mi><mi>S</mi><mi>P</mi><mi>I</mi><mrow><mo>(</mo><mi>A</mi><mo>&cup;</mo><mi>B</mi><mo>)</mo></mrow></mrow><mrow><mi>W</mi><mi>S</mi><mi>P</mi><mi>I</mi><mrow><mo>(</mo><mi>A</mi><mo>)</mo></mrow></mrow></mfrac><mo>+</mo><mfrac><mrow><mi>W</mi><mi>S</mi><mi>P</mi><mi>I</mi><msup><mrow><mo>(</mo><mi>A</mi><mo>&cup;</mo><mi>B</mi><mo>)</mo></mrow><mn>2</mn></msup></mrow><mrow><mo>|</mo><mi>N</mi><mo>|</mo><mo>*</mo><mi>W</mi><mi>S</mi><mi>P</mi><mi>I</mi><mrow><mo>(</mo><mi>A</mi><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0001139109760000013.GIF" wi="1621" he="143" /></maths>其中,WSPI(A)为项目集的加权支持度,N<sub>1</sub>和N<sub>2</sub>是用来平衡支持度和置信度的权重参数,Support(A∪B)指同时包含项目A和B的事务的数量,|N|指事务数据库中事务的总数;WI(A)是包含A的项目集的权重,Trans(A)是包含A的事务的数量;(4)利用加权多种群粒子群算法进行危险源关联规则挖掘:(41)随机初始化粒子的速度和位置,对粒子按照位置聚类产生不同粒子簇;(42)利用适应度函数计算各粒子簇的簇范围CR,将各粒子簇按簇范围递增排序;(43)根据适应度函数更新粒子的最优位置pbest,全局最有位置gbest和所有粒子的全局局部最优位置gpbest;并更新粒子的速度v<sub>ij</sub>(t)和位置x<sub>ij</sub>(t);(44)比较粒子适应度值fitvalue<sub>ij</sub>与粒子所在簇的最小适应度值minfit<sub>i</sub>和最大适应度值maxfit<sub>i</sub>之间的关系:若minfit<sub>i</sub><fitvalue<sub>ij</sub><maxfit<sub>i</sub>,则粒子的位置不变;若fitvalue<sub>ij</sub><minfit<sub>i</sub>并且w<sub>ij</sub>>minw<sub>i‑1</sub>,其中,minw<sub>i‑1</sub>是粒子当前所在簇的前一个簇C<sub>i‑1</sub>的最小权重;将粒子并入第C<sub>i‑1</sub>个簇,并删除簇中具有最小适应度值的num个粒子{d<sub>i‑11</sub>,…,d<sub>i‑1num</sub>},同时,产生num个新粒子{new<sub>i‑11</sub>,…,new<sub>i‑1num</sub>};若fitvalue<sub>ij</sub>>maxfit<sub>i</sub>并且w<sub>ij</sub>>minw<sub>i+1</sub>,其中,minw<sub>i+1</sub>是粒子当前所在簇的后一个簇C<sub>i+1</sub>的最小权重;将粒子并入第C<sub>i+1</sub>个簇,并删除簇中具有最小适应度值的num′个粒子{d<sub>i+11</sub>,…,d<sub>i+1num′</sub>},同时,产生num′个新粒子{new<sub>i+11</sub>,…,new<sub>i+1num′</sub>};(45)重复步骤(42)到步骤(44),直到找到最优粒子产生关联规则或达到迭代次数,从得到的关联规则后继回溯取到规则的前提条件即得到危险源的原因。
地址 210016 江苏省南京市秦淮区御道街29号