发明名称 基于有监督显式流形学算法的电子鼻数据挖掘方法
摘要 本发明涉及一种有监督显式流形学算法进行电子鼻数据挖掘的方法。其中显式流形学算法对电子鼻数据进行数据挖掘的方法的步骤包括:气体样本的采集、气体样本的特征提取、确定特征值矩阵中各点的近邻、计算任意两特征值点的关系和显式流形算法的数据降维。有监督的显式流形学算法对电子鼻数据进行数据挖掘包括上述全部步骤并在气体样本的特征提取后增加一步:考虑类别信息确定特征值矩阵中各点的近邻。本发明的有益效果为:利用显式流形学算法进行电子鼻数据降维,给出了显式降维表达式;利用有监督流形学算进行电子鼻数据降维,考虑到了特征值矩阵中不同来源的各点之间的关系差异,这一细节信息的保留是电子鼻系统高判别率的保障。
申请公布号 CN102890718A 申请公布日期 2013.01.23
申请号 CN201210382585.9 申请日期 2012.10.10
申请人 重庆大学 发明人 田逢春;贾鹏飞;樊澍;冯敬伟;刘涛;刘颖;赵贞贞
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 基于显式流形学习算法的电子鼻数据挖掘方法,其特征是,该方法包括以下步骤:步骤1、气体样本的采集调整实验室温、湿度环境,使得电子鼻系统的各传感器能够正常工作,对不同种类气体中的每一个样本,均进行不少于20次的气体采集实验,获得电子鼻训练用数据;步骤2、气体样本的特征提取对获得的电子鼻训练数据进行特征提取,并构成特征值矩阵X,矩阵X的维数是[m×n],其中m表示特征值点的总数,在数值上等于气体采样实验的总次数,n表示每一个特征值点的维数,由传感器阵列中传感器个数和特征提取方法共同决定,常见的特征提取方法主要包括:1、基于传感器原始响应曲线,该类方法主要对气体传感器的响应曲线进行特征提取,常用的特征包括:最大值、斜率、响应曲线的积分面积等;2、基于拟合曲线,该类方法首先使用适当的模型拟合原始响应曲线,然后再提取模型参数作为特征,常见的用于电子鼻数据拟合的模型有多项式模型、指数模型、分式函数模型等;3、基于变换域的特征提取方法,首先对原始响应进行适当的变换,然后提取变换系数作为特征,常见的电子鼻数据变换域特征提取方法包括:傅里叶变换、小波变换等;步骤3、确定特征值矩阵中各点的近邻确定特征值矩阵中每个点的近邻,常用的确定近邻关系有两种方法:1、ε‑ball法:在以点xi,i=1,..n为圆心,以ε为半径的范围内的所有点都是xi的近邻;2、k‑nearest法:离点xi最近的k个点是xi的近邻且k<n;步骤4、计算任意两特征值点的关系如果特征值矩阵X中点xj是xi的近邻点,那么两者之间的关系wi,j按照某一规则取一个不为零的正数且xi与xj的关系越紧密wi,j的值就越大;如果特征值点xj不是xi的近邻点,那么两者之间的关系wi,j=0;步骤5、显式流形学习算法的数据降维YT=AXT其中,YT是低维目标矩阵Y的转置形式,矩阵Y的维数是[m×l],m表示点的总数,等于矩阵X中特征值点的总数,l表示每一个点的维数且l<n,A是显式映射系数矩阵,特征值矩阵中的点xi和点xj的近邻关系通过wi,j传递给目标矩阵Y中的点yi和点yj,常用的近邻关系传递方法如下式所示: <mrow> <mi>min</mi> <munder> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> </mrow>其中,yi和点yj分别是目标矩阵Y中元素且i≠j,若特征值矩阵X中点xi和xj是近邻且两者距离越近,其近邻关系wi,j的值就会越大,此时上式要取最小值,则(yi‑yj)2项的值就必须尽量的小,如此,将特征值矩阵中的点xi和点xj的近邻关系传递给了目标矩阵Y中的点yi和点yj,然后通过求解上式所描述的最优化问题得到显式映射系数矩阵A,得到显式映射表达式并完成降维。
地址 400044 重庆市沙坪坝区沙坪坝区沙坪坝正街174号
您可能感兴趣的专利