发明名称 基于综合分层聚类的湖库、流域的水质监测断面优化布设方法
摘要 本发明属于水环境监控与治理领域,公开了一种基于综合分层聚类的湖库、流域的水质监测断面优化布设方法,包括以下步骤:首先根据原始采集的水质监测数据建立标准化矩阵,通过5种距离算法计算监测数据变量之间的相似性以获得变量之间的亲疏关系,接着通过4种连接算法以实现对数据集合的自动聚类;然后以加权重的皮尔逊相关系数为判定准则来选择最优组合以进行分层聚类,最后通过生成的相应最优聚类树矩阵,来优化设置断面监测站点,从而可获得反映水域整体水质的监测数据,以提高水环境的监测质量。本方法方便简捷、结果直观、具有很高的可行性。
申请公布号 CN104572878A 申请公布日期 2015.04.29
申请号 CN201410806392.0 申请日期 2014.12.22
申请人 北京工商大学 发明人 连晓峰;王小艺;彭森
分类号 G06F17/30(2006.01)I;G06Q10/04(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京永创新实专利事务所 11121 代理人 祗志洁
主权项 一种基于综合分层聚类的湖库、流域的水质监测断面优化布设方法,其特征在于,包括以下步骤:步骤1:通过监测采集不同断面的水质指标,建立原始数据矩阵Z,将矩阵Z标准化处理后得到矩阵X;矩阵Z为m×n的矩阵,其中m为监测断面个数,n为每个监测断面的水质指标个数;步骤2:将监测断面的水质指标作为变量,对应为矩阵X的列向量,采用五种距离度量方法得出各变量之间的相似性;所述的距离度量方法包括:欧氏距离、标准欧氏距离、马氏距离、布洛克距离以及切比雪夫距离;步骤3:根据变量间的亲疏关系,采用四种连接方法对变量进行聚类;所述的连接方法包括:最短距离法、最长距离法、平均距离法和质心距离法;步骤4:确定连接方法与距离度量方法的相关系数,选取相关系数最大情况下的距离度量方法与连接方法,根据相关系数最大情况下的聚类来优化水质监测断面的布设;设a=1,2,3,4,5分别代表五种距离度量方法,b=1,2,3,4分别代表四种连接方法;对于某种连接方法与距离度量方法的相关系数c<sub>ab</sub>为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>c</mi><mi>ab</mi></msub><mo>=</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&lt;</mo><mi>j</mi></mrow></msub><mi>&alpha;</mi><mrow><mo>(</mo><msub><mi>da</mi><mi>ij</mi></msub><mo>-</mo><mover><mi>da</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mi>&beta;</mi><mrow><mo>(</mo><msub><mi>Db</mi><mi>ij</mi></msub><mo>-</mo><mover><mi>Db</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><msqrt><msub><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&lt;</mo><mi>j</mi></mrow></msub><msup><mrow><mo>(</mo><msub><mi>da</mi><mi>ij</mi></msub><mo>-</mo><mover><mi>da</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&lt;</mo><mi>j</mi></mrow></msub><msup><mrow><mo>(</mo><msub><mi>Db</mi><mi>ij</mi></msub><mo>-</mo><mover><mi>Db</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac><mo>,</mo><mi>a</mi><mo>&Element;</mo><mo>[</mo><mn>1,2,3,4,5</mn><mo>]</mo><mo>,</mo><mi>b</mi><mo>&Element;</mo><mo>[</mo><mn>1,2,3,4</mn><mo>]</mo></mrow>]]></math><img file="FDA0000639924340000011.GIF" wi="1482" he="227" /></maths>其中,i和j分别指代矩阵X中第i个变量与第j个变量,da<sub>ij</sub>表示第a种距离度量方法计算两个变量之间的距离,Db<sub>ij</sub>表示第b种连接方法计算的两个变量之间的距离,<img file="FDA0000639924340000012.GIF" wi="69" he="78" />和<img file="FDA0000639924340000013.GIF" wi="84" he="72" />分别是向量da<sub>ij</sub>和Db<sub>ij</sub>中的平均值;α和β为权重系数,<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>&alpha;</mi><mo>=</mo><mfrac><msub><mi>da</mi><mi>ij</mi></msub><mover><mi>da</mi><mo>&OverBar;</mo></mover></mfrac><mo>,</mo><mi>&beta;</mi><mo>=</mo><mfrac><msub><mi>Db</mi><mi>ij</mi></msub><mover><mi>Db</mi><mo>&OverBar;</mo></mover></mfrac><mo>.</mo></mrow>]]></math><img file="FDA0000639924340000014.GIF" wi="414" he="142" /></maths>
地址 100048 北京市海淀区阜成路33号