发明名称 基于可分离度和相异度的电子鼻信号特征融合方法
摘要 本发明提供了一种基于可分离度和相异度的电子鼻信号特征融合方法,属于电子鼻信号与信息处理技术领域,该方法步骤一对电子鼻信号进行特征提取,步骤二进行特征选择,步骤三特征加权融合,本发明在降维去冗余的同时,最大限度的保留了分类信息,大大提高了分类识别率,从而提高了电子鼻的分类识别性能。
申请公布号 CN106127259A 申请公布日期 2016.11.16
申请号 CN201610513254.2 申请日期 2016.07.04
申请人 西南大学 发明人 彭超;闫嘉;段书凯;王丽丹;贾鹏飞
分类号 G06K9/62(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 重庆为信知识产权代理事务所(普通合伙) 50216 代理人 龙玉洪
主权项 一种基于可分离度和相异度的电子鼻信号特征融合方法,其特征在于,包括如下步骤:S1:对电子鼻信号进行特征提取,得到原始模式样本,原始特征矩阵为:X={X<sub>1</sub>,X<sub>2</sub>,…,X<sub>M</sub>},式中,X<sub>j</sub>(j=1,2,…,M)为矩阵X的子集,M为原始模式样本的维数,电子鼻信号总类别数为C,第n类样本的个数为K<sub>n</sub>,n=1,2,…,C,总的样本个数<img file="FDA0001039825980000011.GIF" wi="322" he="103" />第n类的第i个样本的第m维特征为X<sub>mn</sub>(i),其中,i=1,2,…,K<sub>n</sub>,m=1,2,…,M;S2:特征选择:S21:计算每个特征的可分离度CS,选择可分离度最大的特征作为最优一维特征,并计算该特征的分类识别率;S22:从剩余的特征中任意选择一个特征与最优一维特征组成一个二维特征集,此时可得到M‑1个不同的二维特征集,分别计算这M‑1个二维特征集的可分离度CS和相异度DI之和,将该和最大的两个特征作为选择二维特征时的最优特征集,并计算该最优二维特征的分类识别率;S23:从除了步骤S22选择的最优二维特征以外剩余的特征中任意选择一个新的特征,加入最优二维特征后组成一个三维特征集,此时可得到M‑2个不同的三维特征集,分别计算这M‑2个三维特征的平均可分离度<img file="FDA0001039825980000012.GIF" wi="462" he="150" />式中,D=3为将要选择的最优特征集的维度数,f<sub>i</sub>为选择的某个特征,分别计算M‑2个三维特征集中两两特征组合的相异度之和DI,其中,三维特征的两两组合共有6种情况,算得这六种情况的平均相异度为<img file="FDA0001039825980000013.GIF" wi="238" he="135" />最后把平均可分离度CS′和平均相异度DI'相加;S24:选择平均可分离度和平均相异度之和最大的三个特征作为选择三维特征的最优特征集,并计算该最优三维特征集的分类识别率;S25:设置D=D+1,判断D是否大于M,如果是,则进入步骤S28,否则,跳转至步骤S26;S26:从除了最优D‑1维特征以外的剩余特征中任意选择一个新的特征,加入之前选择的最优D‑1维特征组成D维特征集,可得到M‑D+1个不同的D维特征集,计算这M‑D+1个D维特征集的平均可分离度<img file="FDA0001039825980000021.GIF" wi="461" he="150" />同时计算这M‑D+1个D个特征集中两两特征组合的相异度之和DI,算得这D个特征的平均相异度为<img file="FDA0001039825980000022.GIF" wi="235" he="151" />然后把平均可分离度CS′和平均相异度DI'相加,<img file="FDA0001039825980000025.GIF" wi="75" he="71" />为D个特征集中两两特征组合的组合数;S27:选择D维平均可分离度和平均相异度之和最大的D维特征作为选择D维特征的最优特征集,并计算该最优D维特征集的分类识别率,随后进入步骤S25;S28:选择分类识别率最高的特征维数为最优维度,其对应的特征集为最优特征集;S3:特征加权融合:设有L种基特征,C个类别,S31:L种基特征对所有样本进行识别,得到L个分类正确率a=[a<sub>1</sub>,a<sub>2</sub>,…,a<sub>L</sub>],通过准确率计算权重w=[w<sub>1</sub>,w<sub>2</sub>,…w<sub>L</sub>],其中,<img file="FDA0001039825980000023.GIF" wi="270" he="207" />S32:对L种基特征对每个样本的分类结果进行量化编码,如果对第一种基特征分类器判别为第一类,则编码为δ<sub>1</sub>=[1,0,…0]<sub>1×C</sub>,如果判别为第二类,则编码为δ<sub>1</sub>=[0,1,…0]<sub>1×C</sub>,以此类推,如果对第L种基特征,分类器判别为第C类,则编码为δ<sub>L</sub>=[0,0,…1]<sub>1×C</sub>,最后得到这L种基特征对该样本的分类结果为:<img file="FDA0001039825980000024.GIF" wi="476" he="78" />S33:对分类结果进行融合,融合后的结果为:f=[f<sub>1</sub>,f<sub>2</sub>,…f<sub>C</sub>]=w·δ;S34:最后的融合策略为:predict_label=max[f<sub>1</sub>,f<sub>2</sub>,…,f<sub>C</sub>],即融合结果的值最大的类别为最后融合判别的类。
地址 400715 重庆市北碚区天生路1号