发明名称 基于GP学建模的发酵制药产物质量软测量方法
摘要 一种基于GP学建模的发酵制药产物质量软测量方法,包括以下步骤:1)采集发酵制药过程的历史数据集合L,该数据集合L由不超过200个采集时刻的数据样本{x,y}组成,其中,x是模型的广义输入向量,y是拟预报的质量向量;2)利用GP学算法建立拟预报的关键质量指标的模型f<sup>*</sup>;3)在线采集过程变量x<sup>*</sup>,代入产物质量模型f<sup>*</sup>,得到实时预报的产物质量指标。本发明提供一种具有很高的建模精度、测量准确性高的基于GP学建模的发酵制药产物质量软测量方法。
申请公布号 CN101419216A 申请公布日期 2009.04.29
申请号 CN200810121670.3 申请日期 2008.10.16
申请人 浙江工业大学 发明人 蒋宁;盛颂恩;陈挹
分类号 G01N33/15(2006.01)I;G06N1/00(2006.01)I;C12N1/00(2006.01)I 主分类号 G01N33/15(2006.01)I
代理机构 杭州天正专利事务所有限公司 代理人 王 兵;王利强
主权项 1、一种基于GP学习建模的发酵制药产物质量软测量方法,其特征在于:所述发酵制药产物质量软测量方法包括以下步骤:1)、采集发酵制药过程的历史数据集合L,该数据集合L由不超过200个采集时刻的数据样本{x,y}组成,其中,x是模型的广义输入向量,y是拟预报的质量向量;2)、利用GP学习算法建立拟预报的关键质量指标的模型f*,包括以下步骤:①计算数据样本的协方差子矩阵K<sub>1</sub>K(i,j)=k(x<sub>i</sub>,x<sub>j</sub>)                            (1)式(1)中:元素下标i,j∈[1,l]的正整数,其中变量l≤200表示历史数据集合L的长度;算子k称为协方差函数;②计算待求模型的发酵质量模型f<sup>*</sup>的对数边缘似然函数logp(y|x),及其关于超参数θ的导数信息:<maths num="0001"><![CDATA[<math><mrow><mi>log</mi><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>X</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><msup><mi>y</mi><mi>T</mi></msup><msup><mrow><mo>(</mo><mi>K</mi><mo>+</mo><msubsup><mi>&sigma;</mi><mi>n</mi><mn>2</mn></msubsup><mi>I</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>y</mi><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mi>log</mi><mrow><mo>|</mo><mi>K</mi><mo>+</mo><msubsup><mi>&sigma;</mi><mi>n</mi><mn>2</mn></msubsup><mi>I</mi><mo>|</mo></mrow><mfrac><mi>l</mi><mn>2</mn></mfrac><mi>log</mi><mn>2</mn><mi>&pi;</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中:第1项<img file="A200810121670C00022.GIF" wi="447" he="60" />为数据拟合项,第2项<img file="A200810121670C00023.GIF" wi="342" he="81" />为复杂度惩罚项,最后是一个与训练数据长度有关的归一化常数项;关于超参数θ的导数信息由下式计算得到:<maths num="0002"><![CDATA[<math><mrow><mfrac><mo>&PartialD;</mo><msub><mrow><mo>&PartialD;</mo><mi>&theta;</mi></mrow><mi>j</mi></msub></mfrac><mi>log</mi><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mi>tr</mi><mrow><mo>(</mo><mrow><mo>(</mo><msup><mi>&beta;&beta;</mi><mi>T</mi></msup><mo>-</mo><msup><mrow><mo>(</mo><mi>K</mi><mo>+</mo><msubsup><mi>&sigma;</mi><mi>n</mi><mn>2</mn></msubsup><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mfrac><mrow><mo>&PartialD;</mo><mi>K</mi></mrow><msub><mrow><mo>&PartialD;</mo><mi>&theta;</mi></mrow><mi>j</mi></msub></mfrac><mo>)</mo></mrow><mo>,</mo><mi>&beta;</mi><mo>=</mo><msup><mrow><mo>(</mo><mi>K</mi><mo>+</mo><msubsup><mi>&sigma;</mi><mi>n</mi><mn>2</mn></msubsup><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>y</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>利用式(3)的计算结果,采用优化算法优化对数边缘似然,求出不同协方差函数下的最优超参数θ<sub>opt</sub>,从而确定出最合适的协方差函数;③计算在线样本的GP后验概率模型f(x<sup>*</sup>),简记为产物质量模型f<sup>*</sup>,当新数据x<sup>*</sup>利用后,先计算其对应的协方差参数向量k<sup>*</sup>:k<sup>*</sup>=k(x<sub>i</sub>,x<sup>*</sup>),i=1,…,l    (4)其中,协方差函数和超参数θ采用步骤②中计算的结果,则可得GP后验概率模型为f<sup>*</sup>~N(f<sup>*</sup>,V[f<sup>*</sup>]),其中:<maths num="0003"><![CDATA[<math><mrow><msup><mover><mi>f</mi><mo>&OverBar;</mo></mover><mo>*</mo></msup><mo>=</mo><msubsup><mi>k</mi><mo>*</mo><mi>T</mi></msubsup><msup><mrow><mo>(</mo><mi>K</mi><mo>+</mo><msubsup><mi>&sigma;</mi><mi>n</mi><mn>2</mn></msubsup><mi>I</mi><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mi>y</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>3)、在线采集过程变量x<sup>*</sup>,代入产物质量模型f<sup>*</sup>,得到实时预报的产物质量指标。
地址 310014浙江省杭州市下城区朝晖六区