发明名称 一种基于神经网络的PM2.5实时等级预测方法和系统
摘要 本发明公开了一种基于神经网络的PM2.5实时等级预测方法,采集空气中的污染物指标PM2.5、O3、CO、PM10、SO2、NO2的历史浓度值和大气温度、湿度、风力等大气历史值,以历史数据为训练集对神经网络模型进行训练,构建基于神经网络的综合大气指标的神经网络预测模型;由移动设备端向服务器发送PM2.5等级实时请求,将实时获取的污染指标和大气指标为测试数据代入神经网络预测模型进行预测并推送。本发明的一种基于神经网络的PM2.5实时等级预测方法为PM2.5监测点较少或没有PM2.5监测点城市的移动端用户提供PM2.5等级查询,降低了PM2.5预测成本,可以同时进行天和小时的实时预测,具有较好的通用性。
申请公布号 CN106529081A 申请公布日期 2017.03.22
申请号 CN201611097948.9 申请日期 2016.12.03
申请人 安徽新华学院 发明人 张怡文;敖希勤;汪强;周昊;贾冀;时培俊;郭傲东;费久龙;陈家丽
分类号 G06F17/50(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 主分类号 G06F17/50(2006.01)I
代理机构 温州市品创专利商标代理事务所(普通合伙) 33247 代理人 程春生
主权项 一种基于神经网络的PM2.5实时等级预测方法,其特征在于:(1)采集空气中的污染物离线历史指标PM2.5、O3、CO、PM10、SO2、NO2的浓度值,构建污染物系数矩阵PM:<maths num="0001"><math><![CDATA[<mrow><mi>P</mi><mi>M</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>p</mi><mn>1</mn></msub></mtd><mtd><msub><mi>s</mi><mn>11</mn></msub></mtd><mtd><mn>...</mn></mtd><mtd><msub><mi>s</mi><mn>15</mn></msub></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>p</mi><mi>m</mi></msub></mtd><mtd><msub><mi>s</mi><mrow><mi>m</mi><mn>1</mn></mrow></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>s</mi><mrow><mi>m</mi><mn>5</mn></mrow></msub></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001170042150000011.GIF" wi="934" he="183" /></maths>其中,污染物系数矩阵PM第一列表示为:<img file="FDA0001170042150000012.GIF" wi="358" he="87" />为统计天数的所有PM2.5的值,按照表1等级进行划分;其余列表示为:S<sub>i</sub>=(S<sub>1i</sub>…S<sub>mi</sub>)<sup>T</sup>,i=1,…5,是O3、CO、PM10、SO2、NO2浓度值;其中m为统计天数或小时数;(2)采集空气温度、湿度、风力三个大气离线历史指标,并与空气中的污染物指标相结合,给出综合系数矩阵PMA:<maths num="0002"><math><![CDATA[<mrow><mi>P</mi><mi>M</mi><mi>A</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>P</mi><mn>1</mn></msub></mtd><mtd><msubsup><mi>S</mi><mn>11</mn><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>S</mi><mn>15</mn><mo>&prime;</mo></msubsup></mtd><mtd><msubsup><mi>Q</mi><mn>11</mn><mo>&prime;</mo></msubsup></mtd><mtd><msub><mi>Q</mi><mn>12</mn></msub></mtd><mtd><msubsup><mi>Q</mi><mn>13</mn><mo>&prime;</mo></msubsup></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>P</mi><mi>m</mi></msub></mtd><mtd><msubsup><mi>S</mi><mrow><mi>m</mi><mn>1</mn></mrow><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>S</mi><mrow><mi>m</mi><mn>5</mn></mrow><mo>&prime;</mo></msubsup></mtd><mtd><msubsup><mi>Q</mi><mrow><mi>m</mi><mn>1</mn></mrow><mo>&prime;</mo></msubsup></mtd><mtd><msub><mi>Q</mi><mrow><mi>m</mi><mn>2</mn></mrow></msub></mtd><mtd><msubsup><mi>Q</mi><mrow><mi>m</mi><mn>3</mn></mrow><mo>&prime;</mo></msubsup></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001170042150000013.GIF" wi="1134" he="190" /></maths>综合系数矩阵PMA与污染物系数矩阵PM不同点在于加入了环境系数矩阵Q,Q<sub>mi</sub>矩阵是新加入的温度、湿度、风力三个大气指标矩阵,其中m为统计天数,i=1…3,表示温度、湿度、风力三个指标;(3)采用皮尔逊相关系数的方法,把综合系数矩阵PMA中的O3浓度值、CO浓度值、PM10浓度值、SO2浓度值、NO2浓度值和空气温度指标、湿度指标、风力指标分别代入pearson相关系数计算指标间相似度的计算方法公式(3)所示:<maths num="0003"><math><![CDATA[<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><mi>X</mi><mo>,</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msubsup><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><mrow><mo>(</mo><msub><mi>X</mi><mi>i</mi></msub><mo>-</mo><mover><mi>X</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>Y</mi><mi>i</mi></msub><mo>-</mo><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><mrow><msqrt><mrow><msubsup><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msup><mrow><mo>(</mo><msub><mi>X</mi><mi>i</mi></msub><mo>-</mo><mover><mi>X</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt><msqrt><mrow><msubsup><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></msubsup><msup><mrow><mo>(</mo><msub><mi>Y</mi><mi>i</mi></msub><mo>-</mo><mover><mi>Y</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001170042150000014.GIF" wi="838" he="151" /></maths>其中sim(X,Y)代表X、Y两个指标间的相似度,i代表某种指标的第i个样本,n为样本总数;(4)采用皮尔逊相关系数的方法,把PMA中数据代入公式(3),对PMA中的指标进行合并,合并后的综合指标矩阵为PMA’<maths num="0004"><math><![CDATA[<mrow><msup><mi>PMA</mi><mo>&prime;</mo></msup><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>P</mi><mn>1</mn></msub></mtd><mtd><msubsup><mi>S</mi><mn>11</mn><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>S</mi><mrow><mn>1</mn><mi>n</mi></mrow><mo>&prime;</mo></msubsup></mtd><mtd><msubsup><mi>Q</mi><mn>11</mn><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>Q</mi><mrow><mn>1</mn><mi>i</mi></mrow><mo>&prime;</mo></msubsup></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>P</mi><mi>m</mi></msub></mtd><mtd><msubsup><mi>S</mi><mrow><mi>m</mi><mn>1</mn></mrow><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>S</mi><mrow><mi>m</mi><mi>n</mi></mrow><mo>&prime;</mo></msubsup></mtd><mtd><msubsup><mi>Q</mi><mrow><mi>m</mi><mn>1</mn></mrow><mo>&prime;</mo></msubsup></mtd><mtd><mn>...</mn></mtd><mtd><msubsup><mi>Q</mi><mrow><mi>m</mi><mi>i</mi></mrow><mo>&prime;</mo></msubsup></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001170042150000015.GIF" wi="1142" he="237" /></maths>其中,<img file="FDA0001170042150000016.GIF" wi="365" he="87" />为统计天数的所有PM2.5的值,按照表1等级进行划分;S<sub>i</sub>=(S<sub>1i</sub>…S<sub>mi</sub>)<sup>T</sup>,i≤5,是O3、CO、PM10、SO2、NO2进行指标合并后的浓度值;Q<sub>i</sub>=(Q<sub>1i</sub>…Q<sub>mi</sub>)<sup>T</sup>,i≤3,是温度、湿度、风力指标合并后的值;其中m为统计天数或小时数;(5)用离线数据作训练集训练神经网络,建立基于神经网络的PM2.5预测模型:将择PM、PMA、PMA’作为神经网络的输入层数据集,由BP神经网络模型进行预测:其中输入层神经元将输入的数据传递到隐含层,再由隐含层将数据激活放大后传递到输出层并由输出层输出;其中,输入层与隐含层之间的激励函数采用S函数,如公式(5)所示:<maths num="0005"><math><![CDATA[<mrow><mi>f</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>x</mi></mrow></msup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001170042150000021.GIF" wi="526" he="100" /></maths>当实际误差超出期望误差时,误差值沿网络反向传播修改各神经元之间的连接权值和阈值,重复训练网络,直至满足期望误差,确定输入与输出之间的映射关系。本发明中别选择PM、PMA、PMA’矩阵为输入数据,PM2.5等级预测值为输出进行实验映射。
地址 230088 安徽省合肥市望江西路555号安徽新华学院信息工程学院