发明名称 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法
摘要 一种基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法,主要步骤是:一是采用核函数把原始变量映射到高维空间得到新变量,并进行标准化处理;二是采用最小二乘法对提取的成分进行回归分析,并将回归系数还原;三是采用LOO交叉有效性对模型进行评价;四是重复步骤二到三,每次重复时将成分数增加1,直到提取成分数达到最大值;五是重复步骤一到四,每次重复时将步骤一中的分段数M增加1,直到M等于预设数;六是从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的M和提取成分数建模,作为最终的估算模型。本发明将优化的非线性偏最小二乘回归用于建立森林碳储量预测模型,提高了森林碳储量预测精度。
申请公布号 CN102305792A 申请公布日期 2012.01.04
申请号 CN201110207384.0 申请日期 2011.07.22
申请人 浙江农林大学 发明人 杜华强;周国模;范渭亮
分类号 G01N21/84(2006.01)I 主分类号 G01N21/84(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 周烽
主权项 1.一种基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法,其特征在于按如下步骤进行:(1)、在研究区域内设置调查样地,观测样地内的地上部分生物量并转化为碳储量,获取与观测时间相对应的遥感影像,将遥感影像的多个波段光谱反射率作为自变量,碳储量作为因变量;(2)、按照公式①对自变量空间的每一个自变量x<sub>j</sub>进行高斯核函数变换,得到新的自变量,将因变量与新的自变量进行标准化处理,处理后的数据符合公式②的线性关系;<maths num="0001"><![CDATA[<math><mrow><msub><mi>Z</mi><mi>j</mi></msub><mo>=</mo><mrow><mo>(</mo><msub><mi>z</mi><mrow><mi>j</mi><mo>,</mo><mn>0</mn></mrow></msub><mo>,</mo><msub><mi>z</mi><mrow><mi>j</mi><mo>,</mo><mn>1</mn></mrow></msub><mo>,</mo><msub><mi>z</mi><mrow><mi>j</mi><mo>,</mo><mn>2</mn></mrow></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>z</mi><mrow><mi>j</mi><mo>,</mo><mi>M</mi><mo>+</mo><mn>2</mn></mrow></msub><mo>)</mo></mrow><mo>=</mo><mi>K</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>&xi;</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow><msub><mi>h</mi><mi>j</mi></msub></mfrac><mo>)</mo></mrow></mrow></math>]]></maths>①<maths num="0002"><![CDATA[<math><mrow><mover><mi>y</mi><mo>~</mo></mover><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>p</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>l</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>M</mi><mo>+</mo><mn>2</mn></mrow></munderover><msub><mi>&alpha;</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi></mrow></msub><msub><mover><mi>z</mi><mo>~</mo></mover><mrow><mi>j</mi><mo>,</mo><mi>l</mi></mrow></msub><mo>+</mo><mi>&epsiv;</mi></mrow></math>]]></maths>②其中j=1,2,…,p;l=0,1,2,…,M+2;ξ<sub>j,l-1</sub>=min(x<sub>j</sub>)+(l-1)h<sub>j</sub>,为变量x<sub>j</sub>上划分的区间分点;<img file="FSA00000543092700013.GIF" wi="511" he="117" />为变量x<sub>j</sub>上分段长度;M为变量x<sub>j</sub>上分段数,M的初始值设为1;<img file="FSA00000543092700014.GIF" wi="34" he="50" />为Z标准化后的值;<img file="FSA00000543092700015.GIF" wi="31" he="49" />为y标准化后的值;(3)、对公式②进行线性偏最小二乘回归,其中提取的成分数Cp为1,求得回归系数α<sub>j,l</sub>;将α<sub>j,l</sub>还原为原变量的回归系数β<sub>0</sub>,β<sub>j,l</sub>,最后由全体自变量与因变量的非线性拟合函数公式③得到估计值;<maths num="0003"><![CDATA[<math><mrow><mover><mi>y</mi><mo>^</mo></mover><mo>=</mo><msub><mi>&beta;</mi><mn>0</mn></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>p</mi></munderover><msub><mover><mi>f</mi><mo>^</mo></mover><mi>j</mi></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>&epsiv;</mi><mo>=</mo><msub><mi>&beta;</mi><mn>0</mn></msub><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>p</mi></munderover><munderover><mi>&Sigma;</mi><mrow><mi>l</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>M</mi><mo>+</mo><mn>2</mn></mrow></munderover><msub><mi>&beta;</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi></mrow></msub><mi>K</mi><mrow><mo>(</mo><mfrac><mrow><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><msub><mi>&xi;</mi><mrow><mi>j</mi><mo>,</mo><mi>l</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow><msub><mi>h</mi><mi>j</mi></msub></mfrac><mo>)</mo></mrow></mrow></math>]]></maths>③(4)、采用LOO(Leave One Out)交叉有效性对模型进行评价,LOO交叉有效性检验过程为:去掉一个样本,用剩余n-1个样本建模,并用对去掉的样本进行预测,得到所有样本的估计值;用公式④计算得到估计值与真实值之间的相关系数并作为评价指标;<maths num="0004"><![CDATA[<math><mrow><mi>R</mi><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mover><msub><mi>y</mi><mi>c</mi></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mrow><mo>(</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>i</mi></msub><mo>-</mo><mover><msub><mi>y</mi><mi>e</mi></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow></mrow><msqrt><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><mover><msub><mi>y</mi><mi>c</mi></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mover><mi>y</mi><mo>^</mo></mover><mi>i</mi></msub><mo>-</mo><mover><msub><mi>y</mi><mi>e</mi></msub><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mfrac></mrow></math>]]></maths>④其中<img file="FSA00000543092700022.GIF" wi="39" he="83" />模型估计值,y<sub>i</sub>观测值,<img file="FSA00000543092700023.GIF" wi="49" he="64" />观测平均值;<img file="FSA00000543092700024.GIF" wi="48" he="64" />估计平均值;(5)、重复步骤(3)到(4),每次重复时将Cp增加1,直到提取成分数达到最大值;对于每一个M,核函数变换能把原始p维变量映射到<img file="FSA00000543092700025.GIF" wi="210" he="108" />维空间,可提取的最多成分数为<img file="FSA00000543092700026.GIF" wi="381" he="109" />(6)、重复步骤(2)到(5),每次重复时将步骤(2)中的M增加1,直到M等于预设值n,比如n=8,M<sub>i</sub>=i,i=1,2,...,8;(7)、非线性偏最小二乘回归精度取决于M和Cp,如果各变量的分段数M一定,则对每一个M,Cp从1到C变化,能得到C个模型,这样总共可以建立<img file="FSA00000543092700027.GIF" wi="385" he="125" />个模型;然后,从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的M<sub>j</sub>和Cp建模,作为最终的估算模型。
地址 311300 浙江省临安市环城北路88号