发明名称 基于近红外光谱与信息处理的玉米品种鉴别方法
摘要 本发明公开了一种基于近红外光谱与信息处理的玉米品种鉴别方法,该方法使用傅里叶变换漫反射近红外光谱仪采集玉米种子的光谱数据,根据光谱特点,采用归一化主成分分析,即将样本点在各主轴上的投影的平方和归一化,调整样本点在特征空间中的分布,并根据数据在各主轴上投影的散布情况调整主成分权重,最后采用最近邻分类方法进行分类。与传统化学鉴别方法相比,本发明提供的方法高效,快捷,并且无须专业人士操作。
申请公布号 CN101819141B 申请公布日期 2012.04.25
申请号 CN201010162316.2 申请日期 2010.04.28
申请人 中国科学院半导体研究所 发明人 王徽蓉;李卫军;陈新亮
分类号 G01N21/35(2006.01)I;G06N99/00(2010.01)I 主分类号 G01N21/35(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 1.一种基于近红外光谱与信息处理的玉米品种鉴别方法,其特征在于,该方法包括:获取光谱数据;对训练样本集进行归一化主成分分析,并根据样本点在主轴上的散布情况调整主成分的权重;训练得到的变换矩阵转置后与待测样本相乘并由权重系数进行加权,得到测试样本的样本特征;以及使用最近邻分类方法为分类器进行分类;其中,所述的归一化主成分分析,是将样本主成分分析得到的各主成分进行平方根归一化,具体包括:首先得到训练数据集合x<sub>j</sub>,j=1,...,s的协方差矩阵C<sub>x</sub>,其中s为训练数据集合的个数,然后求出C<sub>x</sub>从大到小排列的特征值λ<sub>k</sub>以及满足条件<maths num="0001"><![CDATA[<math><mrow><msubsup><mi>u</mi><mi>l</mi><mi>T</mi></msubsup><msub><mi>u</mi><mi>k</mi></msub><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mn>1</mn><mo>,</mo><mi>l</mi><mo>=</mo><mi>k</mi></mtd></mtr><mtr><mtd><mn>0</mn><mo>,</mo><mi>l</mi><mo>&NotEqual;</mo><mi>k</mi></mtd></mtr></mtable></mfenced></mrow></math>]]></maths>的特征向量u<sub>k</sub>,然后令<img file="FSB00000556623900012.GIF" wi="283" he="106" />为新的特征向量,将u′<sub>k</sub>按照λ<sub>k</sub>的大小降序排列,并将其作为列组成归一化主成分分析的变换矩阵U,得到样本的特征数据为:y<sub>i</sub>=U<sup>T</sup>x<sub>i</sub>,主成分数目:25~35;所述的根据样本点在主轴上的散布情况调整主成分的权重,是对主成分进行加权,加权系数<maths num="0002"><![CDATA[<math><mrow><msub><mi>h</mi><mi>n</mi></msub><mo>=</mo><msqrt><munder><mi>&Sigma;</mi><mi>k</mi></munder><msup><mrow><mo>(</mo><msub><mover><mi>&beta;</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>-</mo><mover><mi>&beta;</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>/</mo><msqrt><munder><mi>&Sigma;</mi><mi>k</mi></munder><munder><mi>&Sigma;</mi><mi>i</mi></munder><msup><mrow><mo>(</mo><msub><mi>&beta;</mi><mi>ki</mi></msub><mo>-</mo><msub><mover><mi>&beta;</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>,</mo></mrow></math>]]></maths>其中,β<sub>ki</sub>表示第k类的第i样本在第n主轴上的投影值,<img file="FSB00000556623900014.GIF" wi="68" he="59" />表示第k类的所有训练样本在第n主轴上的投影平均值,<img file="FSB00000556623900015.GIF" wi="39" he="57" />表示所有训练样本在第n主轴上的投影平均值,加权后得到的样本特征为:z<sub>i</sub>=(h<sub>1</sub>y<sub>i1</sub>,h<sub>2</sub>y<sub>i2</sub>,...,h<sub>d</sub>y<sub>id</sub>),其中i表示某样本,d表示主成分的数目。
地址 100083 北京市海淀区清华东路甲35号
您可能感兴趣的专利