发明名称 一种近红外光谱鉴别平利绞股蓝的方法
摘要 本发明提供一种近红外光谱鉴别平利绞股蓝的方法,包括如下步骤:A、建立平利绞股蓝的近红外光谱鉴别模型:A‑1、选择光谱范围4000‑12500cm<sup>‑1</sup>,扫描平利绞股蓝近红外光谱图;A‑2、对光谱范围4000‑9500cm<sup>‑1</sup>的数据进行预处理;A‑3、提取主成分;A‑4、建立人工神经网络模型:采取人工神经网络算法,根据输入输出数据特点确定神经网络的结构,再利用训练数据训练此神经网络;运用MATLAB软件建立输入层节点10‑隐含层节点5‑输出层节点2的BP人工神经网络模型;B、未知样品的鉴别:未知样品在相同条件下扫描近红外光谱图,选取主成分数目,依据训练好的神经网络模型来判断未知样品的真伪,输出节点分别用二进制代码表示,10代表是平利绞股蓝,01代表是非平利绞股蓝。
申请公布号 CN103776797B 申请公布日期 2016.09.21
申请号 CN201410065240.X 申请日期 2014.02.25
申请人 河北大学 发明人 赵志磊;李小亭;陈培云;吴广臣;刘秀华
分类号 G01N21/359(2014.01)I 主分类号 G01N21/359(2014.01)I
代理机构 石家庄元汇专利代理事务所(特殊普通合伙) 13115 代理人 王琪
主权项 一种近红外光谱鉴别平利绞股蓝的方法,其特征包括如下步骤:A、建立平利绞股蓝的近红外光谱鉴别模型A‑1、选择光谱范围4000‑12500cm<sup>‑1</sup>,扫描平利绞股蓝近红外光谱图:将有效量的平利绞股蓝样品干燥粉碎后均匀置于石英样品池中,使用傅立叶近红外光谱仪进行吸收光谱扫描;扫描模式为旋转漫反射,分辨率为8cm<sup>‑1</sup>,每个样本扫描多次,取平均光谱为样本最终的分析光谱;A‑2、选取光谱范围4000‑9500cm<sup>‑1</sup>的数据进行预处理:对绞股蓝样本光谱进行多元散射校正+适量归一化的预处理,通过该处理消除样品不均匀、光散射及仪器噪声干扰因素的影响,提高模型的预测精度和稳定性;A‑3、提取主成分:通过主成分分析方法对光谱图信息进行降维,取前10个主成分累计贡献率为99.99%,有限量的输入减少模型的计算复杂度,提高模型的预测精度;所述样本的主成分由如下方法确定:设x<sub>1</sub>,x<sub>2</sub>,…,x<sub>n</sub>为取自总体x的样本,其中x<sub>i</sub>=(x<sub>i1</sub>,x<sub>i2</sub>,…,x<sub>ip</sub>)′,i=1,2,…n;记样本观测值矩阵为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>X</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>x</mi><mn>11</mn></msub></mtd><mtd><msub><mi>x</mi><mn>12</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mn>1</mn><mi>p</mi></mrow></msub></mtd></mtr><mtr><mtd><msub><mi>x</mi><mn>21</mn></msub></mtd><mtd><msub><mi>x</mi><mn>22</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mn>2</mn><mi>p</mi></mrow></msub></mtd></mtr><mtr><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd></mtr><mtr><mtd><msub><mi>x</mi><mrow><mi>n</mi><mn>1</mn></mrow></msub></mtd><mtd><msub><mi>x</mi><mrow><mi>n</mi><mn>2</mn></mrow></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mi>n</mi><mi>p</mi></mrow></msub></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001046045760000011.GIF" wi="469" he="319" /></maths>x的每一行对应一个样品,每一列对应一个变量;记样本协方差矩阵和样本相关系数矩阵分别为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mfrac><mn>1</mn><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>&prime;</mo></msup><mo>=</mo><mrow><mo>(</mo><msub><mi>s</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001046045760000021.GIF" wi="705" he="127" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mover><mi>R</mi><mo>^</mo></mover><mo>=</mo><mrow><mo>(</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><msub><mi>s</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mrow><msqrt><msub><mi>s</mi><mrow><mi>i</mi><mi>i</mi></mrow></msub></msqrt><msqrt><msub><mi>s</mi><mrow><mi>j</mi><mi>j</mi></mrow></msub></msqrt></mrow></mfrac></mrow>]]></math><img file="FDA0001046045760000022.GIF" wi="484" he="134" /></maths>其中,<img file="FDA0001046045760000023.GIF" wi="222" he="126" />为样本平均值;将S作为∑的估计,<img file="FDA0001046045760000024.GIF" wi="37" he="55" />作为R的估计,从S或<img file="FDA0001046045760000025.GIF" wi="38" he="55" />出发可求得样本的主成分;A‑4、建立人工神经网络模型:采取人工神经网络算法,根据输入输出数据特点确定神经网络的结构,再利用训练数据训练此神经网络,得到平利绞股蓝的鉴别模型;B、未知样品的鉴别未知样品在相同条件下扫描近红外光谱图,选取主成分数目,依据训练好的神经网络模型来判断未知样品的真伪,输出节点分别用二进制数字表示,10代表是平利绞股蓝,01代表是非平利绞股蓝;样本的主成分由从样本相关系数矩阵<img file="FDA0001046045760000026.GIF" wi="35" he="60" />出发求解:设<img file="FDA0001046045760000027.GIF" wi="419" he="78" />为<img file="FDA0001046045760000028.GIF" wi="43" he="62" />的p个特征值,<img file="FDA0001046045760000029.GIF" wi="302" he="71" />为相应的正交单位特征向量,则样本的p个主成分为<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mover><mi>y</mi><mo>^</mo></mover><mo>*</mo></msup><mo>=</mo><msup><msub><mover><mi>t</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mo>*</mo><mo>&prime;</mo></msup></msup><msup><mi>x</mi><mo>*</mo></msup><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>p</mi></mrow>]]></math><img file="FDA00010460457600000210.GIF" wi="725" he="103" /></maths>将样品x<sub>i</sub>标准化后的观测值<img file="FDA00010460457600000211.GIF" wi="49" he="63" />代入第j个主成分,即可得到样品x<sub>i</sub>的第j主成分得分<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mover><mi>y</mi><mo>^</mo></mover><mrow><mi>i</mi><mi>j</mi></mrow><mo>*</mo></msubsup><mo>=</mo><msubsup><mover><mi>t</mi><mo>^</mo></mover><mi>j</mi><msup><mo>*</mo><mo>&prime;</mo></msup></msubsup><msubsup><mi>x</mi><mi>i</mi><mo>*</mo></msubsup><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>n</mi><mo>;</mo><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>p</mi><mo>.</mo></mrow>]]></math><img file="FDA0001046045760000031.GIF" wi="1181" he="94" /></maths>
地址 071002 河北省保定市五四东路180号