发明名称 基于协同训练偏最小二乘模型的工业过程软测量建模方法
摘要 本发明公开了一种可用的训练样本个数较少的条件下工业生产过程的软测量研究方法,用于在建模数据较少条件下的软测量建模并实现对于产品信息的预测。本发明利用基于协同训练的偏最小二乘学方法,建立了一个有效的线性预测模型,并克服了工业生产过程采样数据过少的情况下模型精度不高的问题,提高了针对该过程建立的模型预测准确率和性能,从而使得工业生产过程更加可靠,产品质量更加稳定。
申请公布号 CN104914723A 申请公布日期 2015.09.16
申请号 CN201510266557.4 申请日期 2015.05.22
申请人 浙江大学 发明人 包亮;葛志强
分类号 G05B13/04(2006.01)I 主分类号 G05B13/04(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 邱启旺
主权项 一种基于协同训练偏最小二乘模型的工业过程软测量建模方法,其特征在于,包括以下步骤:(1)利用集散控制系统以及离线检测方法,收集工业生产过程的数据组成建模用的训练样本集。对于收集到的训练样本集,一部分为既包含主导变量数据也包含辅助变量信息的样本集D∈R<sup>K×J</sup>,其中,所述D为有标签数据集,K为采样数据点个数,J为变量个数,R为实数集;另一部分为只包含辅助变量数据的样本集X∈R<sup>N×2M</sup>,其中,所述X为无标签数据集,N为采样数据点数,2M为变量个数,将这些数据存入历史数据库。(2)对于每个生产批次的有标签数据,沿着时间点方向对每一个数据矩阵进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为<img file="FDA0000722070960000011.GIF" wi="222" he="70" />(3)基于得到的二维数据矩阵<img file="FDA0000722070960000012.GIF" wi="222" he="73" />按照主导变量和辅助变量分类标准,选取其中的主导变量作为预测目标因变量集<img file="FDA0000722070960000013.GIF" wi="296" he="124" />选取其中的辅助变量作为自变量集<img file="FDA0000722070960000014.GIF" wi="337" he="124" />则该二维数据矩阵<img file="FDA0000722070960000015.GIF" wi="250" he="119" />可以重新描述为:<img file="FDA0000722070960000016.GIF" wi="389" he="141" />(4)对于有标签数据集,对其自变量集进行均分,前一半自变量作为第一自变量视图:<img file="FDA0000722070960000017.GIF" wi="361" he="121" />后一半自变量作为第二自变量视图:<img file="FDA0000722070960000018.GIF" wi="366" he="122" />得到两组新的有标签数据集<img file="FDA0000722070960000019.GIF" wi="426" he="148" />以及<img file="FDA00007220709600000110.GIF" wi="460" he="143" />并按照同样的变量拆分方法对于无标签数据进行拆分,得到两组新的无标签数据集<img file="FDA00007220709600000111.GIF" wi="439" he="140" />和<img file="FDA00007220709600000112.GIF" wi="473" he="142" />(5)首先,利用<img file="FDA00007220709600000113.GIF" wi="422" he="145" />建立初始的模型PLS1,利用<img file="FDA00007220709600000114.GIF" wi="426" he="138" />建立初始的模型PLS2,然后,不断迭代使用无标签数据更新模型训练数据,当达到一定的终止条件时,终止迭代。一般选取的终止条件为迭代达到一定次数抑或是无法继续找到置信度足够高的样本。(6)将建模数据和各个模型参数存入历史数据库和实时数据库中备用。(7)收集新的过程数据,并对其进行预处理和归一化。(8)采用基于协同训练算法的偏最小二乘方法对工业过程的变量进行预测,实现过程监控与控制。
地址 310058 浙江省杭州市西湖区余杭塘路866号