发明名称 基于支持向量机回归的晶体直径测量方法
摘要 本发明公开了一种基于支持向量机回归的晶体直径测量方法,首先采用CCD照相机采集单晶硅生长过程中的孔径图像,对该孔径图像进行预处理得到用于估计的采样点;然后,针对椭圆的标准模型推导出来一个用于支持向量机回归的模型,利用ε-SVR模型解出模型中的权值w及偏移量b,从而确定出椭圆拟合的参数。本发明的方法,能准确的估计晶体生长中的直径变化,使生长中的晶体直径得到很好的控制,又能在很少样本点的情况下进行很好的直径拟合,在解决高维数据时发挥了很大的优势,这是其他方法所不能达到的。
申请公布号 CN102914270B 申请公布日期 2015.12.02
申请号 CN201210391462.1 申请日期 2012.10.12
申请人 西安理工大学 发明人 梁军利;张妙花;范自强;刘丁;梁炎明
分类号 G01B11/08(2006.01)I 主分类号 G01B11/08(2006.01)I
代理机构 西安弘理专利事务所 61214 代理人 李娜
主权项 一种基于支持向量机回归的晶体直径测量方法,其特征在于:首先采用CCD照相机采集单晶硅生长过程中的孔径图像,对该孔径图像进行预处理得到用于估计的采样点;然后,针对椭圆的标准模型推导出来一个用于支持向量机回归的ε‑SVR模型,利用ε‑SVR模型解出权值w及偏移量b<sub>0</sub>,从而确定出椭圆拟合的参数a,b,h,k,所述的ε‑SVR模型的构建过程的具体步骤是:CCD照相机采集单晶硅生长过程中的孔径图像,孔径是一个顺时针旋转角度为0的虚拟椭圆而并非是圆,在笛卡尔坐标下,椭圆中心为(h,k),顺时针旋转角度为θ,长短轴为(a,b),椭圆上的点坐标为(x<sub>0</sub>,y<sub>0</sub>),该椭圆的标准模型见方程式(1):<img file="FDA0000771994330000011.GIF" wi="1556" he="148" />当θ=0°时,代入(1)式,该椭圆的标准模型简化为下式(2):<img file="FDA0000771994330000012.GIF" wi="1180" he="147" />式(2)再转化成如下形式:<img file="FDA0000771994330000013.GIF" wi="485" he="137" /><img file="FDA0000771994330000014.GIF" wi="1339" he="171" /><img file="FDA0000771994330000015.GIF" wi="1372" he="178" /><img file="FDA0000771994330000016.GIF" wi="1305" he="78" /><img file="FDA0000771994330000021.GIF" wi="1347" he="233" /><img file="FDA0000771994330000026.GIF" wi="1403" he="89" />所以式(7)中设定,<img file="FDA0000771994330000022.GIF" wi="697" he="95" /><img file="FDA0000771994330000023.GIF" wi="895" he="158" />由式(7)看出x和y是已知的;b<sub>0</sub>是一个实数,只要求出w和b<sub>0</sub>,椭圆的参数就能够从下式(8)中得到:<img file="FDA0000771994330000024.GIF" wi="1376" he="634" />式(7)就是本方法构造出来的支持向量机回归的ε‑SVR模型,把它看作是一个函数逼近问题采用ε‑SVR方式进行求解,假设给定训练样本{(x<sub>i</sub>,y<sub>i</sub>),i=1,2,…l},其中的x<sub>i</sub>为训练样本,y<sub>i</sub>为所对应的回归值,令f(x)=w<sup>T</sup>x+b<sub>0</sub>,w∈R<sup>d</sup>,b<sub>0</sub>∈R,R<sup>d</sup>是w的一个d维的向量,如果对每个样本x<sub>i</sub>而言,f(x<sub>i</sub>)和y<sub>i</sub>的差值都很小,就说明该f(x<sub>i</sub>)能够准确的从x<sub>i</sub>预测y<sub>i</sub>,此时的w就是要找的平面,SVR的数学表达式为:<img file="FDA0000771994330000025.GIF" wi="400" he="128" />subject to||y<sub>i</sub>‑(w<sup>T</sup>x‑b<sub>0</sub>)||≤ε,                  (9) 其中ε≥0,用来表示SVR的预测值与实际值的最大差距,在ε合理的情况下,从式(9)中能够求出解,这种情况是可行的;然而在大多数应用中,由 于一些误差等各种因素,通常使求出的解不可行,因此通常增加一些松弛变量,以容许某些样本点落在e带之外,因此优化问题改写成以下形式:<img file="FDA0000771994330000031.GIF" wi="735" he="142" /><img file="FDA0000771994330000032.GIF" wi="1549" he="260" />在式(10)中,每个样本都有与其对应的松弛变量ξ<sub>i</sub>和ξ<sup>*</sup><sub>i</sub>,用来决定该样本是否落在了ε的范围之外,而C是惩罚因子,用于调整模型以避免过拟合或欠拟合现象的发生,利用拉格朗日乘子法来解决这个约束优化问题,因此,构造如下的拉格朗日函数:<img file="FDA0000771994330000033.GIF" wi="1641" he="286" />利用最优化理论,将L分别对w、b<sub>0</sub>、ξ<sub>i</sub>、<img file="FDA0000771994330000034.GIF" wi="59" he="82" />求偏微分,并令得到的等式分别为0,得到下式:<img file="FDA0000771994330000035.GIF" wi="1440" he="461" />将式(12)带入到式(11)得到下面的对偶优化问题:<img file="FDA0000771994330000036.GIF" wi="1655" he="463" />则支持向量SV就是使得<img file="FDA0000771994330000037.GIF" wi="247" he="83" />的部分参数,通过学习训练得到的最 优解为<img file="FDA0000771994330000041.GIF" wi="393" he="141" />回归估计函数为<img file="FDA0000771994330000042.GIF" wi="596" he="125" />为避免个别支持向量SV带来的偏差,针对每个支持向量SV求出对应的偏移量,对这些偏移量累加,最后取均值作为偏移量b<sub>0</sub>的最优解,b<sub>0</sub>由下式(14)解出:<img file="FDA0000771994330000043.GIF" wi="1766" he="175" />其中N<sub>SV</sub>为标准的支持向量数,SV表示支持向量,通过学习训练得到回归估计函数为:f(x<sub>i</sub>)=w<sup>T</sup>x<sub>i</sub>+b<sub>0</sub>,即用ε‑SVR模型解出了w和b<sub>0</sub>,最后通过式(8)解出椭圆的参数,即成。
地址 710048 陕西省西安市金花南路5号