一种近红外光谱鉴别平利绞股蓝的方法,申请号CN201410065240.X-传众专利搜索

发明名称	一种近红外光谱鉴别平利绞股蓝的方法
摘要	本发明提供一种近红外光谱鉴别平利绞股蓝的方法，包括如下步骤：A、建立平利绞股蓝的近红外光谱鉴别模型：A‑1、选择光谱范围4000‑12500cm<sup>‑1</sup>，扫描平利绞股蓝近红外光谱图；A‑2、对光谱范围4000‑9500cm<sup>‑1</sup>的数据进行预处理；A‑3、提取主成分；A‑4、建立人工神经网络模型：采取人工神经网络算法，根据输入输出数据特点确定神经网络的结构，再利用训练数据训练此神经网络；运用MATLAB软件建立输入层节点10‑隐含层节点5‑输出层节点2的BP人工神经网络模型；B、未知样品的鉴别：未知样品在相同条件下扫描近红外光谱图，选取主成分数目，依据训练好的神经网络模型来判断未知样品的真伪，输出节点分别用二进制代码表示，10代表是平利绞股蓝，01代表是非平利绞股蓝。
申请公布号	CN103776797B	申请公布日期	2016.09.21
申请号	CN201410065240.X	申请日期	2014.02.25
申请人	河北大学	发明人	赵志磊;李小亭;陈培云;吴广臣;刘秀华
分类号	G01N21/359(2014.01)I	主分类号	G01N21/359(2014.01)I
代理机构	石家庄元汇专利代理事务所(特殊普通合伙) 13115	代理人	王琪
主权项	一种近红外光谱鉴别平利绞股蓝的方法，其特征包括如下步骤：A、建立平利绞股蓝的近红外光谱鉴别模型A‑1、选择光谱范围4000‑12500cm<sup>‑1</sup>，扫描平利绞股蓝近红外光谱图：将有效量的平利绞股蓝样品干燥粉碎后均匀置于石英样品池中，使用傅立叶近红外光谱仪进行吸收光谱扫描；扫描模式为旋转漫反射，分辨率为8cm<sup>‑1</sup>，每个样本扫描多次，取平均光谱为样本最终的分析光谱；A‑2、选取光谱范围4000‑9500cm<sup>‑1</sup>的数据进行预处理：对绞股蓝样本光谱进行多元散射校正+适量归一化的预处理，通过该处理消除样品不均匀、光散射及仪器噪声干扰因素的影响，提高模型的预测精度和稳定性；A‑3、提取主成分：通过主成分分析方法对光谱图信息进行降维，取前10个主成分累计贡献率为99.99％，有限量的输入减少模型的计算复杂度，提高模型的预测精度；所述样本的主成分由如下方法确定：设x<sub>1</sub>，x<sub>2</sub>，…，x<sub>n</sub>为取自总体x的样本，其中x<sub>i</sub>＝(x<sub>i1</sub>，x<sub>i2</sub>，…，x<sub>ip</sub>)′，i＝1，2，…n；记样本观测值矩阵为：<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>X</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>x</mi><mn>11</mn></msub></mtd><mtd><msub><mi>x</mi><mn>12</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mn>1</mn><mi>p</mi></mrow></msub></mtd></mtr><mtr><mtd><msub><mi>x</mi><mn>21</mn></msub></mtd><mtd><msub><mi>x</mi><mn>22</mn></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mn>2</mn><mi>p</mi></mrow></msub></mtd></mtr><mtr><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd></mtr><mtr><mtd><mrow></mrow></mtd></mtr></mtable></mtd><mtd><mtable><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr></mtable></mtd></mtr><mtr><mtd><msub><mi>x</mi><mrow><mi>n</mi><mn>1</mn></mrow></msub></mtd><mtd><msub><mi>x</mi><mrow><mi>n</mi><mn>2</mn></mrow></msub></mtd><mtd><mo>...</mo></mtd><mtd><msub><mi>x</mi><mrow><mi>n</mi><mi>p</mi></mrow></msub></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001046045760000011.GIF" wi="469" he="319" /></maths>x的每一行对应一个样品，每一列对应一个变量；记样本协方差矩阵和样本相关系数矩阵分别为：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>S</mi><mo>=</mo><mfrac><mn>1</mn><mrow><mi>n</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>-</mo><mover><mi>x</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>′</mo></msup><mo>=</mo><mrow><mo>(</mo><msub><mi>s</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001046045760000021.GIF" wi="705" he="127" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mover><mi>R</mi><mo>^</mo></mover><mo>=</mo><mrow><mo>(</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>)</mo></mrow><mo>,</mo><msub><mi>r</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mfrac><msub><mi>s</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mrow><msqrt><msub><mi>s</mi><mrow><mi>i</mi><mi>i</mi></mrow></msub></msqrt><msqrt><msub><mi>s</mi><mrow><mi>j</mi><mi>j</mi></mrow></msub></msqrt></mrow></mfrac></mrow>]]></math><img file="FDA0001046045760000022.GIF" wi="484" he="134" /></maths>其中，<img file="FDA0001046045760000023.GIF" wi="222" he="126" />为样本平均值；将S作为∑的估计，<img file="FDA0001046045760000024.GIF" wi="37" he="55" />作为R的估计，从S或<img file="FDA0001046045760000025.GIF" wi="38" he="55" />出发可求得样本的主成分；A‑4、建立人工神经网络模型：采取人工神经网络算法，根据输入输出数据特点确定神经网络的结构，再利用训练数据训练此神经网络，得到平利绞股蓝的鉴别模型；B、未知样品的鉴别未知样品在相同条件下扫描近红外光谱图，选取主成分数目，依据训练好的神经网络模型来判断未知样品的真伪，输出节点分别用二进制数字表示，10代表是平利绞股蓝，01代表是非平利绞股蓝；样本的主成分由从样本相关系数矩阵<img file="FDA0001046045760000026.GIF" wi="35" he="60" />出发求解：设<img file="FDA0001046045760000027.GIF" wi="419" he="78" />为<img file="FDA0001046045760000028.GIF" wi="43" he="62" />的p个特征值，<img file="FDA0001046045760000029.GIF" wi="302" he="71" />为相应的正交单位特征向量，则样本的p个主成分为<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msup><mover><mi>y</mi><mo>^</mo></mover><mo></mo></msup><mo>=</mo><msup><msub><mover><mi>t</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mo></mo><mo>′</mo></msup></msup><msup><mi>x</mi><mo></mo></msup><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>p</mi></mrow>]]></math><img file="FDA00010460457600000210.GIF" wi="725" he="103" /></maths>将样品x<sub>i</sub>标准化后的观测值<img file="FDA00010460457600000211.GIF" wi="49" he="63" />代入第j个主成分，即可得到样品x<sub>i</sub>的第j主成分得分<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mover><mi>y</mi><mo>^</mo></mover><mrow><mi>i</mi><mi>j</mi></mrow><mo></mo></msubsup><mo>=</mo><msubsup><mover><mi>t</mi><mo>^</mo></mover><mi>j</mi><msup><mo></mo><mo>′</mo></msup></msubsup><msubsup><mi>x</mi><mi>i</mi><mo></mo></msubsup><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>n</mi><mo>;</mo><mi>j</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>p</mi><mo>.</mo></mrow>]]></math><img file="FDA0001046045760000031.GIF" wi="1181" he="94" /></maths>
地址	071002 河北省保定市五四东路180号