一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法,申请号CN201410075308.2-传众专利搜索

发明名称	一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法
摘要	一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法，既属于生物发酵领域，又属于信息科学领域，具体涉及在发酵过程中用于预测在线测量中难以及时取得的质量变量。具体步骤包括：获取训练数据，将数据展开并进行标准化，对标准化的测量数据和质量数据进行核空间中的特征提取，以提取后的特征空间为基进行高维投影，建立偏最小二乘模型，采集实时数据预测质量数据在高维空间中的投影，将高维空间中的质量数据处理为真实的预测值。本发明达到了降低整体模型非线性度，提高模型的预测精度的能力,对实现发酵过程的质量预测、控制和优化控制有重要意义。
申请公布号	CN103810396B	申请公布日期	2016.10.19
申请号	CN201410075308.2	申请日期	2014.03.03
申请人	北京工业大学	发明人	王普;王锡昌;高学金;齐咏生
分类号	G06F19/00(2011.01)I	主分类号	G06F19/00(2011.01)I
代理机构	北京思海天达知识产权代理有限公司 11203	代理人	刘萍
主权项	一种基于特征空间的双核多向偏最小二乘的发酵过程质量预测方法，其特征在于包含以下步骤：步骤(1)：获取训练数据：采集发酵过程中可在线测量的测量变量和难以在线测量的质量变量形成训练数据，具体的一次数据采样表示形式如下：X＝(x<sub>1</sub>,x<sub>2</sub>,...,x<sub>nx</sub>) (1)Y＝(y<sub>1</sub>,y<sub>2</sub>,...,y<sub>ny</sub>) (2)其中，x<sub>1</sub>,x<sub>2</sub>,...,x<sub>nx</sub>表示发酵过程中在线可实时测量的nx个测量变量，即测量点；同理，y<sub>1</sub>,y<sub>2</sub>,...,y<sub>ny</sub>表示发酵过程中在线不可实时测量的ny个质量变量，经过多次采样形成数据X<sub>p,nx,r</sub>和Y<sub>p,ny,r</sub>，其中p表示批次代数，用以区分间歇过程不同的批次，即批次数；r表示采样数；经过测量的数据组成三维矩阵数据：X<sub>3D</sub>和Y<sub>3D</sub>，矩阵规格为批次数×测量点数×采样数；步骤(2)：将X<sub>3D</sub>和Y<sub>3D</sub>按照AT方法进行数据展开和标准化，记录取得的方差和均值，处理后的数据为X<sub>2D</sub>和Y<sub>2D</sub>；步骤(3)：分别对X<sub>2D</sub>和Y<sub>2D</sub>进行核空间中的特征提取，依次得到特征基S<sub>X</sub>和S<sub>Y</sub>；步骤(4)：计算测量数据X<sub>2D</sub>和质量数据Y<sub>2D</sub>到核空间中的投影：选取高斯核函数，利用核技巧将X<sub>2D</sub>、Y<sub>2D</sub>以S<sub>X</sub>和S<sub>Y</sub>为基分别投影到核空间中，得到K<sub>X</sub>＝K(X<sub>2D</sub>,S<sub>X</sub>)和K<sub>Y</sub>＝K(Y<sub>2D</sub>,S<sub>Y</sub>)；步骤(5)：利用得到的数据Kx和K<sub>Y</sub>建立偏最小二乘预测模型：利用偏最小二乘算法建立数据K<sub>X</sub>到K<sub>Y</sub>的映射，并获得PLS映射系数B，具体表现形式为：K<sub>Y</sub>＝K<sub>X</sub>B (3)步骤(6)：在线测量和处理数据，具体步骤为：步骤(6.1)：在线采集新的测量数据X<sub>new</sub>，其数据格式与公式(1)中的X相同；步骤(6.2)：将采集到的新数据X<sub>new</sub>按照建模时刻的AT处理方法进行处理和标准化；步骤(6.3)：利用核技巧将X<sub>new</sub>以S<sub>X</sub>为基投影到核空间中，得到K<sub>Xnew</sub>＝K(X<sub>new</sub>,S<sub>X</sub>)；步骤(7)：将K<sub>Xnew</sub>输入到已建立好的PLS模型中，利用公式(3)得到K<sub>Ynew</sub>，即K<sub>Ynew</sub>＝K<sub>Xnew</sub>B；步骤(8)：将K<sub>Ynew</sub>进行逆映射重构，并逆标准化，得到预测值Y<sub>new</sub>，具体步骤为：步骤(8.1)：利用S<sub>Y</sub>构成新的矩阵数据,其中S<sub>Y</sub>的数据格式为：<img file="FDA0001004510180000021.GIF" wi="1262" he="295" />其中，V<sub>mn</sub>表示S<sub>Y</sub>中的向量矩阵，一共有m个行向量，且每一个行向量的元素个数为n；其中m表示经过特征提取的特征基S<sub>Y</sub>中行向量的个数，n＝ny；经过计算得到的K<sub>Ynew</sub>的数据格式为：K<sub>Ynew</sub>＝(Ky<sub>1</sub>,Ky<sub>2</sub>,...,Ky<sub>m</sub>) (5)令：L＝K<sub>Ynew</sub> (6)对于L中的每一个元素L<sub>i</sub>，i为自然数且i∈[1,m]，L<sub>i</sub>＝Ky<sub>i</sub>；又令：<img file="FDA0001004510180000026.GIF" wi="1358" he="302" /><maths num="0001"><math><![CDATA[<mrow><mi>Lmi</mi><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>L</mi><mn>1</mn></msub><mo>-</mo><msub><mi>L</mi><mi>m</mi></msub></mtd></mtr><mtr><mtd><msub><mi>L</mi><mn>2</mn></msub><mo>-</mo><msub><mi>L</mi><mi>m</mi></msub></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>L</mi><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>-</mo><msub><mi>L</mi><mi>m</mi></msub></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001004510180000025.GIF" wi="1046" he="299" /></maths><img file="FDA0001004510180000024.GIF" wi="1366" he="303" />步骤(8.2)：计算公式Y<sub>new</sub>＝‑0.5(Vmi<sup>T</sup>Vmi)<sup>‑1</sup>Vmi<sup>T</sup>(Lmi‑VmisI) (10)其中V<sub>mi</sub><sup>T</sup>为Vmi的转置，I为所有元素为1的n维列向量；步骤(8.3)：按照AT方法的数据处理方法逆向计算出Y<sub>new</sub>在标准化之前的实际预测数据Y<sub>pre</sub>；步骤(9)：若生产过程未结束，则重复步骤(6)至(8)。
地址	100124 北京市朝阳区平乐园100号