主权项 |
基于模型集群分析的激光诱导击穿光谱变量选择方法, 其特征在于包括以下步骤:(1) 利用激光诱导击穿光谱系统对不同牌号的钢材样品分别在不同的测量位点进行光谱数据采集获得全光谱数据;(2) 对全光谱数据矩阵进行蒙特卡洛采样将全光谱波段划分为若干变量,每个变量为包含一定波长点数的波段,对于全光谱数据 X<sub>m</sub><sub>×n</sub>,其中m为光谱个数,n为变量数,每次采样无放回地从X<sub>m</sub><sub>×n</sub>中抽取s个光谱和q个变量组成一个子数据矩阵R<sub>s</sub><sub>×q</sub>,从X<sub>m</sub><sub>×n</sub>余下的数据中抽取同样的q个变量组成T<sub>(m‑s</sub><sub>)×q</sub>,重复进行N次采样可得到N个子数据矩阵;(3) 子数据矩阵建模分类将每个经蒙特卡洛采样得到的子数据矩阵R<sub>s</sub><sub>×q</sub>作为训练集,对应的T<sub>(m‑s</sub><sub>)×q</sub>作为测试集,用一种改进的支持向量机分类方法——组合模型——对训练集建立子模型,然后用测试集预测分类并计算预测正确率;最后N次采样共得到N个子模型和N个预测正确率;(4)挑选候选有用变量对每一个变量依次进行统计分析检验其是否是有用变量,对于变量<i>i</i><i>,</i>将N个子模型对应的预测正确率分为两组:包含变量<i>i</i>的子模型对应的预测正确率分为A组,不包含变量<i>i</i>的子模型对应的预测正确率分为B组;两组预测正确率的平均值之差Dmean<sub>i</sub>=Mean<sub>i,A</sub>‑Mean<sub>i,B</sub>, 如果Dmean<sub>i</sub>>0,则将变量i作为候选有用变量,否则变量<i>i</i>被认为是无用变量;(5)通过无参数检验确定真实有用变量如果变量<i>i</i>是候选有用变量,利用Mann‑Whitney U检验变量<i>i</i>的A组预测正确率和B组预测正确率进行分析并计算p值,如果p值小于预设阈值,则认为变量<i>i</i>是真正有用变量,否则判定变量<i>i</i>为无用变量。 |