发明名称 一种基于并行模块化神经网络的副产煤气实时预测方法
摘要 一种基于并行模块化神经网络的副产煤气实时预测方法,其特征是首先按照神经网络的状态空间分割的原则,采用Fuzzy c‑means(FCM)聚类将样本数据分为若干类,每一个分类对应一个状态空间的子空间(即模块),再对数据重构以建立预测模型。在建模过程中提出一种改进的回声状态网络,采用模块化方法将神经网络网络状态空间分割成多个独立的子空间,每个子空间就是子网络。结合共享储备池方法,使得所有网络的训练都在同一个储备池中完成,而子空间各自对应一个输出权值矩阵,能更好的模拟系统的运行规律。最后将网络训练问题化简为多个小网络的并行训练问题以加速模型计算过程,引入含有更多有用信息的大数据样本提高了模型的预测精度,并应用Map Reduce计算框架将求解问题并行化,获得较高的加速比,实现冶金煤气系统的实时预测。
申请公布号 CN105930916A 申请公布日期 2016.09.07
申请号 CN201610213761.4 申请日期 2016.04.07
申请人 大连理工大学 发明人 赵珺;车艳军;刘颖;吕政;王伟
分类号 G06Q10/04(2012.01)I;G06Q50/04(2012.01)I;G06N3/08(2006.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 大连理工大学专利中心 21200 代理人 梅洪玉
主权项 一种基于并行模块化神经网络的副产煤气实时预测方法,其特征包括如下步骤:(1)数据读取:从冶金煤气系统现场数据库读取所需的数据;(2)基于回声状态网络的预测:建立回声状态神经网络预测模型对副产煤气进行预测,得到预测结果<img file="FDA0000959330010000011.GIF" wi="115" he="75" />(3)基于并行模块化神经网络的预测校正:构造并行的模块化神经网络并结合第2步预测结果,完成预测值的校正;具体如下:1)建立状态空间分割规则:①读取已知的数据组成一个样本集,输入和输出样本的数据样本集表示为D={(x<sub>i</sub>,y<sub>i</sub>)|<sub>i=1,…,N</sub>},其中输入样本x<sub>i</sub>∈R<sup>d</sup>,输出样本y<sub>i</sub>∈R<sup>l</sup>,N是输入样本的个数;②依据空间中的两个点x(n<sub>1</sub>),x(n<sub>2</sub>)位置接近,那么观测值y(n<sub>1</sub>),y(n<sub>2</sub>)的位置也是接近,通过对输出样本的分割来完成对状态空间的分割;③状态空间划分通过分割Y轴为M段将状态空间划分为M个子空间即模块,利用模糊C均值聚类对输出样本进行聚类,得到M个分类的聚类中心,然后依照状态空间划分函数将样本划分为M个子集;2)建立模块化神经网络模型:共享储备池模块化神经网络是将神经网络的状态空间分割成多个子状态空间,每个子空间样本的训练都在同一个储备池中完成,而子空间各自对应一个输出权值矩阵;网络训练的最终目标是求得最优的输出权值矩阵,使得均方误差(MSE)最小化,网络输出权值的求解转化为求解如下方程组:<maths num="0001"><math><![CDATA[<mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msup><mi>A</mi><mn>1</mn></msup><mo>&CenterDot;</mo><msubsup><mi>W</mi><mrow><mi>o</mi><mi>u</mi><mi>t</mi></mrow><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup></mrow></mtd><mtd><mo>=</mo></mtd><mtd><msup><mi>T</mi><mn>1</mn></msup></mtd></mtr><mtr><mtd><mrow><msup><mi>A</mi><mn>2</mn></msup><mo>&CenterDot;</mo><msubsup><mi>W</mi><mrow><mi>o</mi><mi>u</mi><mi>t</mi></mrow><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></msubsup></mrow></mtd><mtd><mo>=</mo></mtd><mtd><msup><mi>T</mi><mn>2</mn></msup></mtd></mtr><mtr><mtd><mrow><msup><mi>A</mi><mn>3</mn></msup><mo>&CenterDot;</mo><msubsup><mi>W</mi><mrow><mi>o</mi><mi>u</mi><mi>t</mi></mrow><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></msubsup></mrow></mtd><mtd><mo>=</mo></mtd><mtd><msup><mi>T</mi><mn>3</mn></msup></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mrow></mrow></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mrow><msup><mi>A</mi><mi>M</mi></msup><mo>&CenterDot;</mo><msubsup><mi>W</mi><mrow><mi>o</mi><mi>u</mi><mi>t</mi></mrow><mrow><mo>(</mo><mi>M</mi><mo>)</mo></mrow></msubsup></mrow></mtd><mtd><mo>=</mo></mtd><mtd><msup><mi>T</mi><mi>M</mi></msup></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000959330010000012.GIF" wi="405" he="383" /></maths>采用线性回归算法确定输出权值,即:<img file="FDA0000959330010000021.GIF" wi="798" he="87" /><img file="FDA0000959330010000022.GIF" wi="68" he="63" />是矩阵A的广义逆,采用SVD方法求取<img file="FDA0000959330010000023.GIF" wi="91" he="70" />当使用海量数据训练网络时,<img file="FDA0000959330010000024.GIF" wi="168" he="71" />计算量远大于计算<img file="FDA0000959330010000025.GIF" wi="193" he="78" />根据矩阵运算法则,将矩阵求取按如下公式计算:<img file="FDA0000959330010000026.GIF" wi="942" he="103" />至此,将模块化神经网络模型的求解转化为求解<img file="FDA0000959330010000027.GIF" wi="419" he="79" />3)算法的并行加速:在Map函数中,按照前文指定的规则对左矩阵与右矩阵进行拆分,并分配指定的key和样本的分类号;在Reduce中,把相同key值的数据读入到数组中并进行计算,输出是结果矩阵并保存到分布式文件系统的输出文件中;4)校正预测结果:应用得到的神经网络分割规则判断预测结果<img file="FDA0000959330010000028.GIF" wi="90" he="71" />所属的状态子空间;应用得到的模型的输出权值矩阵对预估值网络得到的预测结果进行校正得到最终估计值<img file="FDA0000959330010000029.GIF" wi="65" he="63" />(4)结果分析和精度统计:统计预测性能指标,供现场调度人员进行参考;(5)预测结果的存储:将预测结果及精度统计结果存储到数据库。
地址 116024 辽宁省大连市甘井子区凌工路2号