发明名称 高精度分辨中药材品种、产地及生长方式的红外光谱特征提取方法
摘要 本发明披露了一种高精度分辨中药材品种、产地及生长方式的红外光谱特征提取方法。此方法取得用于训练的每个品种的中药材样本的红外光谱后再将其预处理,根据产地及生长方式将样本分类,并计算出各品种的类间类内差异比谱函数,借以取得各样本的特征向量,再将这些特征向量降维及进行分布优化,从而取得类间距离大而类内距离小的训练样本特征向量集。在该特征向量集形成过程中所获得的类间类内差异比谱函数以及降维矩阵和分布优化变换矩阵即可被用于送检样本的红外光谱特征提取,从而使该送检样本得到自动识别。
申请公布号 CN101498661B 申请公布日期 2011.07.20
申请号 CN200810005068.3 申请日期 2008.01.30
申请人 香港浸会大学 发明人 张晓明;王太君
分类号 G01N21/25(2006.01)I;G06F19/00(2006.01)I 主分类号 G01N21/25(2006.01)I
代理机构 深圳新创友知识产权代理有限公司 44223 代理人 彭家恩
主权项 一种提取一个对象品种的红外光谱特征的方法,包括以下步骤:(1)根据最少一个分类条件,将该品种的对象分成多个类别,并获取属于该品种的多个已知类别的样本;(2)将该多个样本以随机方式分成一个训练样本集及一个测试样本集,该训练样本集包括多个训练样本,该测试样本集包括多个测试样本;(3)测定该多个样本的红外光谱;(4)对该多个训练样本的红外光谱进行一系列预处理,获得该多个训练样本的一阶导数谱;(5)从该多个训练样本的一阶导数谱,计算该品种的类间类内差异比谱函数;类间类内差异比谱函数的定义为类内均值方差谱除以类内方差均值谱;类内均值方差谱及类内方差均值谱从该品种各类训练样本的一阶导数谱的幅度值计算出;(6)将该类间类内差异比谱函数归一化;(7)求该类间类内差异比谱函数的多个局部极大点;(8)在该多个局部极大点提取该多个训练样本的一阶导数谱的幅度值,作为该多个训练样本的原始特征向量;(9)对该多个训练样本的原始特征向量进行降维处理,得到一个降维矩阵;(10)对该多个降维后的特征向量进行多维特征空间中的分布优化,从而得到一个分布优化变换矩阵,包括以下步骤:A.由该多个训练样本的特征向量计算出该多个类别的均值向量及协方差矩阵;B.将该每一个类别的协方差矩阵以样本数的比率加权后求和,得到平均协方差矩阵;C.计算出该平均协方差矩阵的多个本征值及对应的本征向量;D.将最大本征值和最小本征值的差与一个既定的微小阈值进行比较;E.如果最大本征值和最小本征值的差小于该既定的微小阈值,则转向步骤H;否则,将各本征向量合并成为一个本征向量矩阵,并用相应的各本征值的倒数组成的对角矩阵左乘该本征向量矩阵的转置矩阵,其结果作为中间过程的变换矩阵;F.利用该中间过程的变换矩阵对该多个特征向量进行线性变换,所得结果作为新的特征向量;G.重复步骤A至步骤F,直至最大本征值和最小本征值的差比该既定的微小阈值小;以及H.将该各中间过程的变换矩阵依次相乘,以最后一个在最左及第一个在最右,得到总的分布优化变换矩阵;在步骤A至步骤G的迭代中,每一次迭代均会产生一个中间过程变换矩阵,而且均会改善训练样本特征向量在该多维特征空间中的分布;这种迭代一直进行到该平均协方差矩阵的最大本征值和最小本征值的差小于该既定阈值为止;(11)确定距离阈值,设计分类算法,并根据该距离阈值及该分类算法对该多个测试样本进行试分类;以及(12)调节该距离阈值及该分类算法,重复步骤(4)到步骤(11),直至该试分类所测得的正确识别率高过一个既定的比率,然后将该类间类内差异比谱函数的多个局部极大点、降维矩阵、分布优化变换矩阵、距离阈值及分类算法储存。
地址 中国香港九龙九龙塘