发明名称 一种基于特征向量和最小二乘支持向量机的PM2.5浓度预测方法
摘要 本发明涉及一种基于特征向量和最小二乘支持向量机的PM2.5浓度预测方法,属于环境污染预测领域。本发明首先收集与PM2.5浓度相关的污染物浓度数据进行预处理;然后计算综合气象指数;再对与PM2.5浓度相关的污染物浓度数据、综合气象指数进行相关性分析,得到包含综合气象指数的特征向量构成特征向量A和得到去除综合气象指数的特征向量构成特征向量B;最后通过特征向量A、特征向量B构成训练样本训练LS‑SVM模型并对预测结果进行评价。本发明结合环境监测数据和实际情况,将空气湿度、风力、温度三个因素与PM2.5的形成机理相结合,提出综合气象指数公式这一新的概念;预测精度较高。
申请公布号 CN104008278B 申请公布日期 2017.02.15
申请号 CN201410201739.9 申请日期 2014.05.14
申请人 昆明理工大学 发明人 贺建峰;李龙;马磊;邵党国;易三莉;相艳;刘立芳
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 代理人
主权项 一种基于特征向量和最小二乘支持向量机的PM2.5浓度预测方法,其特征在于:首先收集与PM2.5浓度相关的污染物浓度数据进行预处理;然后计算综合气象指数;再对与PM2.5浓度相关的污染物浓度数据、综合气象指数进行相关性分析,得到包含综合气象指数的特征向量构成特征向量A和得到去除综合气象指数的特征向量构成特征向量B;最后通过特征向量A、特征向量B构成训练样本训练LS‑SVM模型并对预测结果进行评价;所述方法的具体步骤如下:Step1、收集与PM2.5浓度相关的污染物浓度数据进行预处理:选取与PM2.5浓度相关的污染物浓度数据进行汇总;其中对于有缺失的数据,则采用平均值法将其补全;Step2、计算综合气象指数:将空气湿度、风力、温度三个因素与PM2.5的形成机理相结合,提出综合气象指数:<i>D</i>=1.8×<i>T</i>+0.55(1‑<i>H</i>)+3.2<i>W</i><sup>1/2</sup>+27式中,<i>D</i>为综合气象指数,无量纲;<i>T</i>为平均气温,量纲为℃;<i>H</i>为平均相对湿度,量纲为%;<i>W</i>为平均风速,量纲为m/s;Step3、相关性分析:采用皮尔逊相关系数方法确定相关的污染物浓度数据、综合气象指数与PM2.5浓度相关性的大小,得出与PM2.5浓度呈正相关、呈负相关的数据,选择相关系数绝对值大于0.6的因素构成特征向量;其中,包含综合气象指数的特征向量构成特征向量A,去除综合气象指数的特征向量构成特征向量B;Step4、预测模型的预测结果评价:将收集的PM2.5浓度值<i>y</i><sub><i>i</i></sub>、特征向量A数据<i>x</i><sub><i>i</i>1</sub>,<i>x</i><sub><i>i</i>2</sub>,<i>x</i><sub><i>i</i>2</sub>,<i>x</i><sub><i>i</i>3</sub>,<i>x</i><sub><i>i</i>4</sub>,…,<i>x</i><sub><i>in</i></sub>、特征向量B数据<i>x</i><sub><i>i</i>1</sub>,<i>x</i><sub><i>i</i>2</sub>,<i>x</i><sub><i>i</i>2</sub>,<i>x</i><sub><i>i</i>3</sub>,<i>x</i><sub><i>i</i>4</sub>,…,<i>x</i><sub><i>im</i></sub>分为两组,一组数据为训练组,另一组数据为测试组:通过训练组的PM2.5的浓度真实值分别与训练组的特征向量A、训练组的特征向量B构成训练样本A和训练样本B训练LS‑SVM模型,得到PM2.5预测模型A、PM2.5预测模型B;使用PM2.5预测模型A、测试组的特征向量A和PM2.5预测模型B、测试组的特征向量B分别对测试组的PM2.5的浓度值进行预测;再通过测试组的PM2.5的浓度预测值与测试组的PM2.5浓度真实值选用均方误差MSE和绝对误差ABS分别对PM2.5预测模型A、PM2.5预测模型B预测的PM2.5的浓度预测值进行评价;其中,<i>i</i>表示收集数据的天数,<i>n</i>表示特征向量A的样本容量,<i>m</i>表示特征向量B的样本容量,<i>m</i>=<i>n</i>‑1。
地址 650093 云南省昆明市五华区学府路253号