发明名称 基于连续投影算法的近红外波长变量选择方法
摘要 本发明公开了一种基于连续投影算法的近红外波长变量选择方法。利用权重值方法,将全谱分成三类:相关波数点集、无关波数点集、噪声波数点集,在“相关波数点集”、“无关波数点集”中选取波数点集,建立校正模型,采用正交投影来判断新选入的波长变量的重要性。该方法克服线性相关性、有效降低数据维数、最大限度提取解释信息,确保建立的校正模型校正具有较高的稳健性。
申请公布号 CN103927438A 申请公布日期 2014.07.16
申请号 CN201410145445.9 申请日期 2014.04.11
申请人 中国科学院重庆绿色智能技术研究院 发明人 刘永福;徐泽宇;赵健;林远长;何国田;石珍;朱晓强;吴姣娇
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 成都赛恩斯知识产权代理事务所(普通合伙) 51212 代理人 高利丹
主权项 基于连续投影算法的近红外波长变量选择方法,其特征在于:包括如下步骤:(A)对近红外光谱进行预处理,对校正集和验证集样本进行划分;(B)利用预处理后的校正集近红外的全谱建立校正模型,设权重值为W,将其作为阈值,计算全谱X的权重值W,其计算如公式(1)所示;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>W</mi><mo>=</mo><mfrac><mn>1</mn><msqrt><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>y</mi><mrow><mi>i</mi><mo>,</mo><mi>actual</mi></mrow></msub><mo>-</mo><msub><mi>y</mi><mrow><mi>i</mi><mo>,</mo><mi>predicted</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></mfrac></msqrt></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000489818760000011.GIF" wi="1624" he="270" /></maths>(C)把校正集谱阵X等分为Num个子区间{I<sub>1</sub>,I<sub>2</sub>,…,I<sub>Num</sub>},对每个波数点I<sub>i</sub>分别建立校正模型,计算各子区间的权重值<img file="FDA0000489818760000012.GIF" wi="414" he="96" />得出权重值W<sub>i</sub>,根据阈值大小,将全部波数点划分为三个集合:相关波数集S<sub>1</sub>、无关波数集S<sub>2</sub>、噪声波数集S<sub>3</sub>,计算如公式(2)所示,其中:α为阈值浮动上限比例,β为阈值浮动下限比例,0<β<1<α<2;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mfenced open='' close=''><mtable><mtr><mtd><msub><mi>S</mi><mn>1</mn></msub><mo>=</mo><msub><mi>S</mi><mn>1</mn></msub><mo>&cap;</mo><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><msub><mi>W</mi><mi>i</mi></msub><mo>></mo><mi>&alpha;W</mi></mtd></mtr><mtr><mtd><msub><mi>S</mi><mn>2</mn></msub><mo>=</mo><msub><mi>S</mi><mn>2</mn></msub><mo>&cap;</mo><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><mi>&alpha;W</mi><mo>&GreaterEqual;</mo><msub><mi>W</mi><mi>i</mi></msub><mo>&GreaterEqual;</mo><mi>&beta;W</mi></mtd></mtr><mtr><mtd><msub><mi>S</mi><mn>3</mn></msub><mo>=</mo><msub><mi>S</mi><mn>3</mn></msub><mo>&cap;</mo><msub><mi>I</mi><mi>i</mi></msub><mo>,</mo><msub><mi>W</mi><mi>i</mi></msub><mo>&lt;</mo><mi>&beta;W</mi></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000489818760000013.GIF" wi="1638" he="231" /></maths>(D)选择相关波数集里面的波数点作为初始点,第一次迭代(p=1),选取S<sub>1</sub>集合中的波长点x<sub>j</sub>,记为x<sub>k(0)</sub>,即k(0)=j,j∈1,…,|S<sub>1</sub>|;(E)把还没选入的相关波数点、无关波数点集合中列向量位置的集合记为S,其中<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mo>{</mo><mi>j</mi><mo>,</mo><mn>1</mn><mo>&le;</mo><mi>j</mi><mo>&le;</mo><msub><mi>m</mi><mn>1</mn></msub><mo>,</mo><mi>j</mi><mo>&NotElement;</mo><mo>{</mo><mi>k</mi><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mi>k</mi><mrow><mo>(</mo><mi>p</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>}</mo><mo>}</mo><mo>;</mo></mrow>]]></math><img file="FDA0000489818760000015.GIF" wi="847" he="86" /></maths>(F)根据公式(3)分别计算剩余列向量x<sub>j</sub>(j∈s)与当前所选向量x<sub>k(p‑1)</sub>的投影;<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>Px</mi><mi>j</mi></msub><mo>=</mo><msub><mi>x</mi><mi>j</mi></msub><mo>-</mo><mo>[</mo><msubsup><mi>x</mi><mi>j</mi><mi>T</mi></msubsup><msub><mi>x</mi><mrow><mtext>k</mtext><mrow><mo>(</mo><mi>p</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msub><mo>]</mo><msub><mi>x</mi><mrow><mi>k</mi><mrow><mo>(</mo><mi>p</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msub><msup><mrow><mo>[</mo><msup><msub><mi>x</mi><mrow><mi>k</mi><mrow><mo>(</mo><mi>p</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msub><mi>T</mi></msup><msub><mi>x</mi><mrow><mi>k</mi><mrow><mo>(</mo><mi>p</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></msub><mo>]</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>,</mo><mi>j</mi><mo>&Element;</mo><mi>s</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000489818760000014.GIF" wi="1632" he="113" /></maths>(G)提取最大投影值的波长变量序号:k(p)=arg[max(||Px<sub>j</sub>||)],j∈s;(H)令x<sub>j</sub>=Px<sub>j</sub>,j∈s,p=p+1,如果p<h,返回第(F)步;(I)将投影向量最大的波长引入到波长组合,最终选取的波长变量为{k(p),p=0,…,h‑1},每循环一个进行交互验证分析,每个新选入的波长,都与前一个线性关系最小,最小SEP对应的k(p)为最终选择的波长组合,最后根据最优波数点集建立校正集模型。
地址 400714 重庆市北碚区方正大道266号