一种基于传统在线监测仪的污染事件快速探测方法,申请号CN201410535694.9-传众专利搜索

发明名称	一种基于传统在线监测仪的污染事件快速探测方法
摘要	本发明提供了一种基于传统在线监测仪的污染事件快速探测方法，属于环境工程水处理技术领域。所述方法包括：构建无污染背景数据库和有污染背景数据库；构建复合序列，预设模型参数，优化训练得到最优参数；建立优化后的污染事件探测识别矩阵，实时识别污染事件。本发明能够利用目前监测点已普及安装的传统在线监测仪器，在突发污染事件发生时在短时间内确定污染事件的发生，同时有效避免因仪器噪声波动引起的污染事件误报，与新兴的在线监测技术相比，可大幅降低污染事件在线监测成本，覆盖所有可能导致污染事件的污染物，最大限度地保障水系统的安全性与可靠性。
申请公布号	CN104217040A	申请公布日期	2014.12.17
申请号	CN201410535694.9	申请日期	2014.10.11
申请人	清华大学	发明人	刘书明;车晗;吴雪
分类号	G06F17/30(2006.01)I;G01N33/18(2006.01)I;G06Q50/26(2012.01)I	主分类号	G06F17/30(2006.01)I
代理机构	北京鸿元知识产权代理有限公司 11327	代理人	邸更岩
主权项	一种基于传统在线监测仪的污染事件快速探测方法，该方法包括：1)构建无污染背景数据库和有污染背景数据库；所述构建无污染背景数据库包括：利用在线监测仪器，获取在线监测设备可实时在线监测的指标过去至少一个月内的水质数据序列，分别建立每个指标无污染背景下的水质基线，构建无污染背景水质数据序列数据库；所述在线监测指标包括但不限于：pH、浊度、温度、电导率、氧化还原电位、总有机碳、硝态氮和正磷酸盐；所述构建有污染背景数据库包括：通过模拟污染物投加试验，利用在线监测仪器，获取在线监测设备可实时在线监测的指标在污染物投入这一时间段内的水质数据序列，建立有污染背景下水质数据序列数据库；2)构建复合水质数据序列集，预设模型参数，优化训练得到最优参数：从无污染背景数据库和有污染背景数据库中分别提取不同指标下同一时段内的数据序列样本，构建多个同时包含无污染背景与有污染背景的复合水质数据序列集；预设污染探测动态窗口序列个数参数L，计算预设污染探测动态窗口序列个数下各监测参数复合水质数据序列集间的皮尔逊相关系数r<sub>xy</sub>，构建水质指标序列相关系数矩阵M<sub>1</sub>；<img file="FDA0000585011050000011.GIF" wi="374" he="202" />其中，水质指标序列相关系数矩阵M<sub>1</sub>包含N行N列，N为监测指标的个数，矩阵中第x行第y列对应第x、y两个监测指标复合数据序列间的皮尔逊相关系数值，其计算方法为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>r</mi><mi>xy</mi></msub><mo>=</mo><mfrac><mrow><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></msubsup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mrow><mo>(</mo><mi>y</mi><mo>-</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><msqrt><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></msubsup><msup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt><msqrt><msubsup><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>L</mi></msubsup><msup><mrow><mo>(</mo><mi>y</mi><mo>-</mo><mover><mi>y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000585011050000012.GIF" wi="1744" he="185" /></maths>其中，x和y分别代表两种不同的监测参数，x，y∈(pH,ORP,UV‑254……)；<img file="FDA0000585011050000013.GIF" wi="36" he="51" />和<img file="FDA0000585011050000014.GIF" wi="33" he="59" />分别代表x和y参数所在序列的均值；预设污染探测相关系数阈值参数K<sub>1</sub>，构建水质指标序列相关系数警报矩阵M<sub>2</sub>；<img file="FDA0000585011050000015.GIF" wi="407" he="200" />其中，水质指标序列相关系数警报矩阵包含N行N列，N为监测指标的个数，第x行第y列对应的位置用C<sub>xy</sub>表示，分别对应“1”或“0”；水质序列相关系数矩阵M<sub>1</sub>中，大于污染探测相关系数阈值的元素，在水质指标序列相关系数警报矩阵M<sub>2</sub>的相同位置记为“1”，反之记为“0”；即：如果\|r<sub>xy</sub>\|<K<sub>1</sub>,或者r<sub>xy</sub>＝1,则C<sub>xy</sub>＝0 (2)如果K<sub>1</sub>≤\|r<sub>xy</sub>\|<1，则C<sub>xy</sub>＝1 (3)预设污染探测相关系数超标个数阈值K<sub>2</sub>，构建污染事件探测识别矩阵M<sub>3</sub>；<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>M</mi><mn>3</mn></msub><mo>=</mo><mfenced open='(' close=')'><mtable><mtr><mtd><msub><mi>D</mi><mn>11</mn></msub></mtd><mtd><msub><mi>D</mi><mn>12</mn></msub></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>D</mi><mrow><mi>T</mi><mn>1</mn></mrow></msub></mtd><mtd><msub><mi>D</mi><mrow><mi>T</mi><mn>2</mn></mrow></msub></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000585011050000021.GIF" wi="370" he="201" /></maths>污染事件探测识别矩阵包括T行2列，T为从开始计算的时刻到结束计算时刻的整数时间步长；在每一时间步长下，分析水质指标序列相关系数警报矩阵中的污染探测相关系数超标个数；所述污染探测相关系数超<u>标个数阈值</u>为触发污染警报的污染探测相关系数超标个数的最小值，当污染探测相关系数超标个数超过该阈值时，即：当D<sub>x1</sub>＝T<sub>x</sub>时，且<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><munderover><mi>Σ</mi><mi>x</mi><mo>&ForAll;</mo></munderover><munderover><mi>Σ</mi><mi>y</mi><mo>&ForAll;</mo></munderover><mi>Σ</mi><msub><mi>C</mi><mi>xy</mi></msub><mo>&GreaterEqual;</mo><msub><mi>K</mi><mn>2</mn></msub><mo>,</mo><mi>x</mi><mo>&NotEqual;</mo><mi>y</mi><mo>,</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>&Element;</mo><mo>{</mo><mi>pH</mi><mo>,</mo><mi>ORP</mi><mo>,</mo><mi>UV</mi><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000585011050000022.GIF" wi="1745" he="132" /></maths>触发污染警报，记为D<sub>x2</sub>＝1；反之，不触发污染警报，记为D<sub>x2</sub>＝0；其中，污染探测相关系数超标个数为水质指标序列相关系数警报矩阵中，“1”出现的次数；即水质序列相关系数矩阵中，大于污染探测相关系数阈值的个数值；计算每一复合水质数据序列集的错报率FNR与漏报率FPR；其中，错报率FNR为在复合水质序列无污染背景数据序列部分中，污染事件探测识别矩阵出现“1”的次数占无污染背景数据序列个数值的百分比；漏报率FPR为在复合水质序列有污染背景数据序列部分中，污染事件探测识别矩阵出现“0”的次数占有污染背景数据序列个数值的百分比；若计算后的错报率与漏报率均达到可接受的范围，通常为5‑10％，则可以直接将预设参数应用于实际监测中，否则，利用遗传算法优化上述三个参数，即污染探测动态窗口序列个数参数、污染探测相关系数阈值参数和污染探测相关系数超标个数阈值，重复步骤2)的所有过程，直至错报率与漏报率达到可接受的范围；3)建立优化后的污染事件探测识别矩阵，实时识别污染事件将优化后的三个参数应用于实际实时监测过程中，即获得实时的污染事件探测识别矩阵；当污染事件探测识别矩阵中元素为1时，代表该时刻发生污染；元素为0时，代表该时刻没有污染发生。
地址	100084 北京市海淀区100084信箱82分箱清华大学专利办公室