发明名称 在线近红外样本量确定方法
摘要 本发明提供一种在线近红外样本量确定方法,其特征在于,包括如下步骤:步骤一、仅采集全体样本的光谱信息;步骤二、对收集到的光谱信息所形成的矩阵进行PCA投影;步骤三、构造近红外光谱的统计量;步骤四、计算总体样本空间T值的标偏和每个样本近红外光谱的T值;对全体样本空间的T值以不同百分比进行抽样;在每个百分比下随机抽取k次,计算每个比例下样本T值的稳定性;步骤五:不同百分比抽样下的样本空间的T值标偏与总体的样本的T值标偏的差异小于预定值时所对应的抽样比例,即为所需在线近红外样本量的取样比例。本发明的在线近红外样本量确定方法能够准确的确定构建近红外模型所需的样本量。
申请公布号 CN105136736A 申请公布日期 2015.12.09
申请号 CN201510582139.6 申请日期 2015.09.14
申请人 上海创和亿电子科技发展有限公司 发明人 张军;薛庆逾;石超
分类号 G01N21/359(2014.01)I 主分类号 G01N21/359(2014.01)I
代理机构 上海精晟知识产权代理有限公司 31253 代理人 冯子玲
主权项 一种在线近红外样本量确定方法,其特征在于,包括如下步骤:步骤一、仅采集全体样本的光谱信息,而不进行具体成分的分析;步骤二、对收集到的光谱信息所形成的矩阵进行PCA投影;步骤三、构造近红外光谱的统计量:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>T</mi><mrow><mi>h</mi><mi>i</mi></mrow><mn>2</mn></msubsup><mo>=</mo><mfrac><msubsup><mi>t</mi><mrow><mi>h</mi><mi>i</mi></mrow><mn>2</mn></msubsup><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mn>1</mn><mo>)</mo><msubsup><mi>s</mi><mi>h</mi><mn>2</mn></msubsup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000802381610000011.GIF" wi="637" he="157" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>T</mi><mi>i</mi><mn>2</mn></msubsup><mo>=</mo><mfrac><mn>1</mn><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>h</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mfrac><msubsup><mi>t</mi><mrow><mi>h</mi><mi>i</mi></mrow><mn>2</mn></msubsup><msubsup><mi>s</mi><mi>h</mi><mn>2</mn></msubsup></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000802381610000012.GIF" wi="639" he="148" /></maths>可以证明<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfrac><mrow><msup><mi>n</mi><mn>2</mn></msup><mrow><mo>(</mo><mi>n</mi><mo>-</mo><mi>m</mi><mo>)</mo></mrow></mrow><mrow><mi>m</mi><mrow><mo>(</mo><msup><mi>n</mi><mn>2</mn></msup><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mfrac><msubsup><mi>T</mi><mi>i</mi><mn>2</mn></msubsup><mo>~</mo><mi>F</mi><mrow><mo>(</mo><mi>m</mi><mo>,</mo><mi>n</mi><mo>-</mo><mi>m</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000802381610000013.GIF" wi="992" he="156" /></maths>其中T<sub>hi</sub>表示的是第i个样本的累积贡献率,t<sub>hi</sub>表示的是第i个样本的贡献率,s<sub>hi</sub>表示的第m个主成分的标偏,n是指样本量;F表示的是F分布;步骤四、计算总体样本空间T值的标偏,计算每个样本近红外光谱的T值;对全体样本空间的T值以不同百分比进行抽样;把近红外模型的准确性转换成近红外光谱的稳定性计算,在每个百分比下随机抽取k次,计算每个比例下样本T值的稳定性;步骤五:比较不同百分比抽样下的样本空间的T值标偏与总体样本变化的T值标偏;样本空间的T值标偏与总体的样本的T值标偏的差异小于预定值时所对应的抽样比例,即为所需在线近红外样本量的取样比例。
地址 201808 上海市嘉定区曹新公路1352号1幢6635室
您可能感兴趣的专利