发明名称 一种近红外光谱分析中的异常样本识别方法
摘要 本发明公开了一种近红外光谱分析中的异常样本识别方法,本发明结合半数重采样和Cook距离算法对近红外光谱分析数据进行异常样本识别。首先改变半数重采样算法的结果表达方式,对光谱数据进行异常样本识别,然后利用Cook距离方法针对化学值进行异常样本识别,均通过偏最小二乘建模效果选取各自的最佳置信区间,联合二者作为本方法中的置信区间;对于同时出现在两种方法下的异常样本,若为高杠杆值点,则剔除,否则保留。本发明结合两种相互独立的算法,能够处理光谱异常和化学值异常同时存在或只存在一种的情况,并对特殊的异常样本进行深入判断,保留由于自身特性而被识别出的特异样本,增强了模型的适用性和稳定性。
申请公布号 CN106596465A 申请公布日期 2017.04.26
申请号 CN201710123913.6 申请日期 2017.03.03
申请人 东北农业大学 发明人 王艳;尹艳玲;沈维政;孙红敏;李晓明
分类号 G01N21/359(2014.01)I 主分类号 G01N21/359(2014.01)I
代理机构 代理人
主权项 一种近红外光谱分析中的异常样本识别方法,其特征在于:步骤1:改变半数重采样算法的结果表达方式;步骤2:利用改变后的半数重采样算法对原始光谱数据进行异常样本识别,选择最佳置信区间;步骤3:利用Cook距离方法对化学值数据进行异常样本识别,选择最佳置信区间;步骤4:作样本散点图,判断特异样本;步骤5:将散点图左上方区域、右下方区域样本点标记为异常样本点。
地址 150030 黑龙江省哈尔滨市香坊区木材街59号