发明名称 基于半监督领域自适应的气体检测方法
摘要 本发明公开了一种基于半监督领域自适应的气体检测方法,包括步骤:对气体传感器采集的气体数据信号进行预处理;利用预处理后的信号构造特征子空间;根据构造特征子空间建立组合核函数;选择目标域中无标记样本;根选择的目标域中无标记样本训练分类器,根据得到的训练分类器进行气体识别。本发明根据气体传感器数据的时间序列特点,通过对领域自适应的核函数进行构造,提出了目标域的无标记样本的选择策略,能有效处理气体传感器数据及传感器漂移,新的核函数既考虑了靠近源域和目标域的子空间应该有更大的权重,又考虑了源域和目标域之间的中间数据,利用格拉斯曼流型几何来描述气体传感器的漂移,有效解决漂移对气体检测和识别的影响。
申请公布号 CN103412003B 申请公布日期 2015.06.10
申请号 CN201310366955.4 申请日期 2013.08.21
申请人 电子科技大学 发明人 刘启和;杜晓松;叶茂;蔡洪斌;张建中
分类号 G01N27/00(2006.01)I 主分类号 G01N27/00(2006.01)I
代理机构 成都宏顺专利代理事务所(普通合伙) 51227 代理人 周永宏
主权项 一种基于半监督领域自适应的气体检测方法,具体包括如下步骤:S1.对气体传感器采集的气体数据信号进行预处理;步骤S1的具体过程如下:采集一持续时间段的数据,对数据进行小波变换,每个样本经过预处理后表示为一个N维实数向量,即X=(x<sub>1</sub>,x<sub>2</sub>,…,x<sub>N</sub>);S2.利用步骤S1预处理后的信号构造特征子空间;步骤S2的具体过程如下:S21.将多个样本数据按照时间的先后组成数据集D<sub>1</sub>,D<sub>2</sub>,…,D<sub>i</sub>,…,D<sub>T</sub>,其中,T表示时间段,D<sub>1</sub>={X<sub>1</sub>,X<sub>2</sub>,…,X<sub>n</sub>},共有n个样本,每个样本被人工标记,其中,X<sub>i</sub>的类标记为Y<sub>i</sub>∈{‑1,1},1表示正样本,即待检测的气体,‑1表示负样本,为其它气体;D<sub>1</sub>是唯一的标记样本集,D<sub>2</sub>,……,D<sub>T</sub>是无标签样本集,数据集D<sub>i</sub>可以表示为矩阵形式,用D<sub>i</sub>表示这个样本矩阵;S22.对样本数据D<sub>i</sub>进行特征中心化、进行主成分分析,得到每个d维度的特征子空间,其中,d是预先设计的一个整数,且d&lt;N;特征中心化:D<sub>i</sub>=D<sub>i</sub>‑ones(size(D<sub>i</sub>,1),1)×mean(D<sub>i</sub>),其中,size(D<sub>i</sub>,1)表示矩阵D<sub>i</sub>行数dim,ones(size(D<sub>i</sub>,1),1)表示构建一个dim维且元素都为1的列向量,mean(D<sub>i</sub>)表示一个维数等于矩阵D<sub>i</sub>列数的行向量,每一元素表示矩阵D<sub>i</sub>对应列向量的均值;对特征中心化后的每个D<sub>i</sub>,进行主成分分析,得到特征子空间,其具体步骤如下:计算样本矩阵D<sub>i</sub>的协方差矩阵H<sub>i</sub>;计算协方差矩阵H<sub>i</sub>的特征向量的特征值,并把特征值按从大到小排序;提取最大的d个特征值,其对应的特征向量为特征子空间的基底,构成一个矩阵S<sub>i</sub>,S<sub>i</sub>为D<sub>i</sub>特征子空间,其维度为N×d;通过上述处理,每个D<sub>i</sub>可以通过S<sub>i</sub>变为低维度d的数据,S<sub>i</sub>是对应子空间,且S<sub>1</sub>,S<sub>2</sub>,…..,S<sub>T</sub>都是R<sup>N</sup>的d维子空间,记R<sup>N</sup>的所有d维子空间为G<sub>N×d</sub>,称为格拉斯曼流型,所述S<sub>i</sub>∈G<sub>N×d</sub>;S3.根据步骤S2构造特征子空间建立组合核函数;步骤S3的具体过程如下:S31.构建权重核函数,S311.选定S<sub>1</sub>、S<sub>T</sub>分别为源域D<sub>1</sub>,目标域D<sub>T</sub>的特征子空间,则S<sub>1</sub>和S<sub>T</sub>为格拉斯曼流型G<sub>N×d</sub>上的点,在G<sub>N×d</sub>上构建一条从S<sub>1</sub>到S<sub>T</sub>的曲线,设曲线的参数化函数Φ(t):[0,1]→G<sub>N×d</sub>,具体如下:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>&Phi;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>S</mi><mn>1</mn></msub><mo>,</mo></mtd><mtd><mi>t</mi><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mn>0</mn><mo>&lt;</mo><mi>t</mi><mo>&lt;</mo><mn>1</mn></mtd></mtr><mtr><mtd><msub><mi>S</mi><mi>T</mi></msub><mo>,</mo></mtd><mtd><mi>t</mi><mo>=</mo><mn>1</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000652100410000021.GIF" wi="820" he="235" /></maths>其中,R<sub>1</sub>是S<sub>1</sub>的垂直补子空间,U<sub>1</sub>和U<sub>2</sub>分别是d×d和(N‑d)×d的对角矩阵,具体通过矩阵SVD分解计算得到:S<sub>1</sub>'S<sub>T</sub>=U<sub>1</sub>ΓV',R<sub>1</sub>'S<sub>T</sub>=‑U<sub>2</sub>ΣV';其中,S<sub>1</sub>'表示S<sub>1</sub>的转置矩阵,Γ和Σ是d×d的对角矩阵,其对角线上的元素分别为cos(θ<sub>i</sub>)和sin(θ<sub>i</sub>),其中,i∈{1,2,……,d},同样,Γ(t)和Σ(t)的对角元素分别为cos(tθ<sub>i</sub>)和sin(tθ<sub>i</sub>);通过以上计算,可以得到U<sub>1</sub>和U<sub>2</sub>,Γ(t)和Σ(t),从而得到Φ(t);S312.设w(t):[0,1]→R为权重函数,w(t)=|1‑2t|,用w(t)乘以Φ(t),得到g(t)=w(t)Φ(t);S313.g(t)在每个点上代表一个子空间的带权重的基底,对g(t)表示的无限维的希尔伯特空间的内积求和,即内积&lt;g(t),g(t)&gt;表示g(t)'g(t)在[0,1]区间进行积分,其积分为矩阵G:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>G</mi><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>g</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>&prime;</mo></msup><mi>g</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><msup><mrow><mo>(</mo><mi>w</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Phi;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>&prime;</mo></msup><mi>w</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Phi;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><mi>&Phi;</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>&prime;</mo></msup><mi>&Phi;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mrow>]]></math><img file="FDA0000652100410000022.GIF" wi="1305" he="111" /></maths>由<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>&Phi;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mo>[</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mo>,</mo><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mo>]</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000652100410000023.GIF" wi="1207" he="157" /></maths>带入上式可得:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>G</mi><mo>=</mo><msup><mrow><mo>[</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mo>,</mo><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mo>]</mo></mrow><mo>&prime;</mo></msup><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><mfenced open='[' close=']'><mtable><mtr><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mfenced open='[' close=']'><mtable><mtr><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mi>dt</mi><mo>[</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mo>,</mo><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mo>]</mo></mrow>]]></math><img file="FDA0000652100410000024.GIF" wi="1414" he="164" /></maths>则:<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mrow><mi>G</mi><mo>=</mo><msup><mrow><mo>[</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mo>,</mo><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mo>]</mo></mrow><mo>&prime;</mo></msup><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup></mrow><mfenced open='[' close=']'><mtable><mtr><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr><mtr><mtd><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd><mtd><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mi>dt</mi><mo>[</mo><msub><mi>S</mi><mn>1</mn></msub><msub><mi>U</mi><mn>1</mn></msub><mo>,</mo><mo>-</mo><msub><mi>R</mi><mn>1</mn></msub><msub><mi>U</mi><mn>2</mn></msub><mo>]</mo></mrow>]]></math><img file="FDA0000652100410000025.GIF" wi="1410" he="156" /></maths>由于Γ(t)和Σ(t)为对角矩阵,且其对角元素分别为cos(tθ<sub>i</sub>)和sin(tθ<sub>i</sub>),则设Ω=[S<sub>1</sub>U<sub>1</sub>,‑R<sub>1</sub>U<sub>2</sub>],则可设G有下面的形式:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>G</mi><mo>=</mo><msup><mi>&Omega;</mi><mo>&prime;</mo></msup><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>&Lambda;</mi><mn>1</mn></msub></mtd><mtd><msub><mi>&Lambda;</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>&Lambda;</mi><mn>2</mn></msub></mtd><mtd><msub><mi>&Lambda;</mi><mn>3</mn></msub></mtd></mtr></mtable></mfenced><mi>&Omega;</mi><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mi>a</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000652100410000026.GIF" wi="974" he="170" /></maths>其中,Λ<sub>1</sub>,Λ<sub>2</sub>,Λ<sub>3</sub>是d×d的对角矩阵,设其对角元素分别为λ<sub>1i</sub>,λ<sub>2i</sub>,λ<sub>3i</sub>,其中i∈{1,2,……,d}:<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msub><mi>&lambda;</mi><mrow><mn>1</mn><mi>i</mi></mrow></msub><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><mi>cos</mi><msup><mrow><mo>(</mo><msub><mi>t&theta;</mi><mi>i</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mi>dt</mi><mo>,</mo></mrow>]]></math><img file="FDA0000652100410000027.GIF" wi="507" he="113" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>&lambda;</mi><mrow><mn>2</mn><mi>i</mi></mrow></msub><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><mi>cos</mi><mrow><mo>(</mo><msub><mi>t&theta;</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>sin</mi><mrow><mo>(</mo><msub><mi>t&theta;</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>dt</mi></mrow>]]></math><img file="FDA0000652100410000031.GIF" wi="625" he="109" /></maths><maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>&lambda;</mi><mrow><mn>3</mn><mi>i</mi></mrow></msub><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><mi>sin</mi><msup><mrow><mo>(</mo><msub><mi>t&theta;</mi><mi>i</mi></msub><mo>)</mo></mrow><mn>2</mn></msup><mi>dt</mi></mrow>]]></math><img file="FDA0000652100410000032.GIF" wi="486" he="115" /></maths>S314.定义核函数:K(X<sub>i</sub>,X<sub>j</sub>)=X<sub>i</sub>'G X<sub>j</sub>,其中,X<sub>i</sub>,X<sub>j</sub>是源域D<sub>1</sub>和目标域D<sub>T</sub>中任意样本向量;S32.计算组合核函数,S321.根据步骤S22可知,D<sub>1</sub>,D<sub>2</sub>,……,D<sub>T</sub>其对应格拉斯曼流型的子空间为S<sub>1</sub>,S<sub>2</sub>,.....,S<sub>T</sub>,设Φ<sub>i‑j</sub>(t):[0,1]→G<sub>N×d</sub>是格拉斯曼流型上从S<sub>i</sub>到S<sub>j</sub>的一条曲线,定义如下:<maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><msub><mi>&Phi;</mi><mrow><mi>i</mi><mo>-</mo><mi>j</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><msub><mi>S</mi><mi>i</mi></msub><mo>,</mo></mtd><mtd><mi>t</mi><mo>=</mo><mn>0</mn></mtd></mtr><mtr><mtd><msub><mi>S</mi><mi>i</mi></msub><msub><mi>U</mi><mn>1</mn></msub><mi>&Gamma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>-</mo><msub><mi>R</mi><mi>i</mi></msub><msub><mi>U</mi><mn>2</mn></msub><mi>&Sigma;</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mn>0</mn><mo>&lt;</mo><mi>t</mi><mo>&lt;</mo><mn>1</mn></mtd></mtr><mtr><mtd><msub><mi>S</mi><mi>j</mi></msub><mo>,</mo></mtd><mtd><mi>t</mi><mo>=</mo><mn>1</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000652100410000033.GIF" wi="859" he="253" /></maths>则w(t)Φ<sub>i‑j</sub>(t)表示从S<sub>i</sub>到S<sub>j</sub>的一条权重曲线;S322.对任意的j∈{2,3,……,T‑1},定义如下从S<sub>1</sub>到S<sub>T</sub>的权重曲线:<maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><mi>w</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>w</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mn>0</mn><mo>&le;</mo><mi>t</mi><mo>&lt;</mo><mn>1</mn></mtd></mtr><mtr><mtd><mi>w</mi><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><msub><mi>&Phi;</mi><mrow><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>,</mo></mtd><mtd><mn>1</mn><mo>&le;</mo><mi>t</mi><mo>&lt;</mo><mn>2</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000652100410000034.GIF" wi="947" he="171" /></maths>w(t)Φ<sub>1‑j‑T</sub>(t)表示从S<sub>1</sub>到S<sub>T</sub>的经过S<sub>j</sub>的一条权重曲线;则内积&lt;w(t)Φ<sub>1‑j‑T</sub>(t),w(t)Φ<sub>1‑j‑T</sub>(t)&gt;表示w(t)<sup>2</sup>Φ<sub>1‑j‑T</sub>(t)'Φ<sub>1‑j‑T</sub>(t)从0到2积分,可得:<maths num="0012" id="cmaths0012"><math><![CDATA[<mfenced open='' close=''><mtable><mtr><mtd><msub><mi>G</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>2</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>&prime;</mo></msup><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd></mtr><mtr><mtd><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi></mrow></msub><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>&prime;</mo></msup><msub><mi>&Phi;</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi><mo>+</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mn>1</mn></msubsup><mi>w</mi><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mn>2</mn></msup><msub><mi>&Phi;</mi><mrow><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>&prime;</mo></msup><msub><mi>&Phi;</mi><mrow><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd></mtr><mtr><mtd><mo>=</mo><msub><mi>G</mi><mrow><mn>1</mn><mo>-</mo><mi>j</mi></mrow></msub><mo>+</mo><msub><mi>G</mi><mrow><mi>j</mi><mo>-</mo><mi>T</mi></mrow></msub></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000652100410000035.GIF" wi="1206" he="308" /></maths>其中,G<sub>i‑j</sub>表示根据公式(a)计算的S<sub>i</sub>到S<sub>j</sub>的权重核函数;G<sub>1‑j‑T</sub>定义了一个源域D<sub>1</sub>和目标域D<sub>T</sub>中的核函数如下:K(X<sub>i</sub>,X<sub>j</sub>)=X<sub>i</sub>′G<sub>1‑j‑T</sub>X<sub>j</sub>S323.根据步骤S322,得到源域D<sub>1</sub>和目标域D<sub>T</sub>中T‑1个核函数集合,其对应的核矩阵集合为{G<sub>1‑T</sub>,G<sub>1‑2‑T</sub>,……,G<sub>1‑(T‑1)‑T</sub>},其中,G<sub>1‑T</sub>表示根据公式(a)计算的S<sub>1</sub>到S<sub>T</sub>的权重核函数,利用这些核函数构造组合核函数的核矩阵如下:G<sub>c</sub>=w<sub>1</sub>G<sub>1‑T</sub>+w<sub>2</sub>G<sub>1‑2‑T</sub>+......+w<sub>T‑1</sub>G<sub>1‑(T‑1)‑T</sub>其中,w<sub>1</sub>,w<sub>2</sub>,……,w<sub>T‑1</sub>是预先设定的权重值,则对应的核函数为:K(X<sub>i</sub>,X<sub>j</sub>)=X<sub>i</sub>'G<sub>c</sub>X<sub>j</sub>               (b)其中,X<sub>i</sub>,X<sub>j</sub>是源域D<sub>1</sub>和目标域D<sub>T</sub>中任意样本向量,式(b)定义的函数即为组合核函数;S4.选择目标域中无标记样本;步骤S4的具体过程如下:S41.设源域D<sub>1</sub>={X<sub>1</sub>,X<sub>2</sub>,……,X<sub>n</sub>}共n个标记样本,目标域D<sub>T</sub>={X<sub>n+1</sub>,X<sub>n+2</sub>,……,X<sub>n+q</sub>}共q个无标记样本;从目标域D<sub>T</sub>中选择一个子集来进行无监督学习,使得选择的子集能给分类器提供增量知识去自适应目标领域;首先描述D<sub>T</sub>中子集与D<sub>1</sub>的相似性:D<sub>T</sub>的任意子集可以用一个0,1的q维向量表示:μ=(μ<sub>1</sub>,μ<sub>2</sub>,……,μ<sub>q</sub>),其中,μ<sub>i</sub>=1表示X<sub>n+i</sub>在这个子集中,否则,μ<sub>i</sub>=0表示X<sub>n+i</sub>不在这个子集中;用最小化均值来表示这个子集的样本与源域D<sub>1</sub>中样本的相似性:<img file="FDA0000652100410000041.GIF" wi="655" he="149" />其中,<img file="FDA0000652100410000042.GIF" wi="110" he="68" />表示样本的高维特征函数,m=μ<sub>1</sub>+μ<sub>2</sub>+……+μ<sub>q</sub>,即m表示子集的样本个数,||||表示希尔伯特空间的范数,从D<sub>T</sub>中选中最相似D<sub>1</sub>的子集,即最优化上面等式:<img file="FDA0000652100410000043.GIF" wi="1119" he="145" /><img file="FDA0000652100410000044.GIF" wi="196" he="100" />表示使得{}中取得最小值的参数μ,式(c)是个NP问题,为解决上述优化问题,定义向量α:<maths num="0013" id="cmaths0013"><math><![CDATA[<mrow><mi>&alpha;</mi><mo>=</mo><mrow><mo>(</mo><msub><mi>&alpha;</mi><mn>1</mn></msub><mo>,</mo><msub><mi>&alpha;</mi><mn>2</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>&alpha;</mi><mi>q</mi></msub><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mfrac><msub><mi>&mu;</mi><mn>1</mn></msub><mi>m</mi></mfrac><mo>,</mo><mfrac><msub><mi>&mu;</mi><mn>2</mn></msub><mi>m</mi></mfrac><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>.</mo><mfrac><msub><mi>&mu;</mi><mi>q</mi></msub><mi>m</mi></mfrac><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000652100410000045.GIF" wi="798" he="122" /></maths>则0≤α<sub>i</sub>≤1,且α<sub>1</sub>+α<sub>2</sub>+……+α<sub>q</sub>=1,带入公式(c)可得<img file="FDA0000652100410000046.GIF" wi="1195" he="146" />S42.由于<img file="FDA0000652100410000047.GIF" wi="106" he="69" />表示将样本的高维特征函数,而公式(c)中的核函数已经实现了高维空间映射,为此,设范数对应的核函数为公式(c)中组合核函数,则<img file="FDA0000652100410000048.GIF" wi="907" he="89" />设矩阵A=(K(X<sub>n+i</sub>,X<sub>n+j</sub>))<sub>q×q</sub>是目标域D<sub>T</sub>的样本核矩阵,B=(K(X<sub>i</sub>,X<sub>n+j</sub>))<sub>n×q</sub>是源域到目标域的样本核矩阵,则公式(d)可化简为:<maths num="0014" id="cmaths0014"><math><![CDATA[<mrow><munder><mrow><mi>arg</mi><mi>mix</mi></mrow><mrow><mi>&alpha;</mi><mo>&Element;</mo><msup><mrow><mo>[</mo><mn>0,1</mn><mo>]</mo></mrow><mi>q</mi></msup></mrow></munder><mrow><mo>(</mo><mi>&alpha;A</mi><msup><mi>&alpha;</mi><mo>&prime;</mo></msup><mo>-</mo><mfrac><mn>2</mn><mi>n</mi></mfrac><mi>TB</mi><msup><mi>&alpha;</mi><mo>&prime;</mo></msup><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000652100410000051.GIF" wi="495" he="145" /></maths>其中,T=(1,1,……,1)是一个q维向量,上式是一个二次优化问题,其约束条件为0≤α<sub>i</sub>,且α<sub>1</sub>+α<sub>2</sub>+……+α<sub>q</sub>=1,解出最优的α;S43.得到α后,设集合Z={X<sub>n+j</sub>|α<sub>j</sub>≥τ,X<sub>n+j</sub>∈D<sub>T</sub>},其中,参数τ是预先设定的阈值参数,D<sub>T</sub>=D<sub>T</sub>–Z,即在目标域中将Z中元素去掉,D<sub>T</sub>被用来作为半监督学习中的无标记样本;S5.根据步骤S4选择的目标域中无标记样本训练分类器,根据得到的训练分类器进行气体识别;步骤S5的具体过程如下:S51.采用基于流形规则化半监督学习方法,其中,核函数为步骤S323中公式(b)中的组合核函数,训练样本集为源域D<sub>1</sub>和通过步骤S43计算后选择的D<sub>T</sub>;设经过步骤S43后D<sub>T</sub>={X<sub>n+1</sub>,X<sub>n+2</sub>,……,X<sub>n+p</sub>}共p个无标记样本,D<sub>1</sub>={X<sub>1</sub>,X<sub>2</sub>,……,X<sub>n</sub>}共n个标记样本,X<sub>i</sub>的标签为y<sub>i</sub>,对D<sub>1</sub>和D<sub>T</sub>进行归一化处理;S52.设分类函数为f(X),为输入向量X到实数的函数,则流形规则化在再生希尔伯特空间搜索一个最优分类器,其优化的目标函数为:<maths num="0015" id="cmaths0015"><math><![CDATA[<mrow><msup><mi>f</mi><mo>*</mo></msup><mo>=</mo><munder><mrow><mi>arg</mi><mi>mix</mi></mrow><mrow><mi>f</mi><mo>&Element;</mo><msub><mi>H</mi><mi>K</mi></msub></mrow></munder><mrow><mo>(</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>V</mi><mrow><mo>(</mo><msub><mi>X</mi><mi>i</mi></msub><mo>,</mo><msub><mi>y</mi><mi>i</mi></msub><mo>,</mo><mi>f</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>&gamma;</mi><mi>A</mi></msub><msub><mrow><mo>|</mo><mo>|</mo><mi>f</mi><mo>|</mo><mo>|</mo></mrow><msub><mi>H</mi><mi>K</mi></msub></msub><mo>+</mo><mfrac><msub><mi>&gamma;</mi><mi>I</mi></msub><msup><mrow><mo>(</mo><mi>n</mi><mo>+</mo><mi>p</mi><mo>)</mo></mrow><mn>2</mn></msup></mfrac><msup><mi>F</mi><mo>&prime;</mo></msup><mi>LF</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mi>e</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000652100410000052.GIF" wi="1395" he="146" /></maths>其中,V(X<sub>i</sub>,y<sub>i</sub>,f)为代价函数,取Hinge函数,即V(X<sub>i</sub>,y<sub>i</sub>,f)=max(0,1‑y<sub>i</sub>f(X<sub>i</sub>)),F=(f(X<sub>1</sub>),f(X<sub>2</sub>),……,f(X<sub>n+p</sub>)),<img file="FDA0000652100410000053.GIF" wi="125" he="75" />是组合核函数K诱导的再生希尔伯特空间的范数,L是D<sub>1</sub>和D<sub>T</sub>中数据邻接矩阵的拉普拉斯变换,γ<sub>A</sub>,γ<sub>I</sub>是预先定义的参数;S53.D<sub>1</sub>和D<sub>T</sub>中数据的邻接图按照KNN方法来构造,其中,样本间的距离按照下式定义:d(X<sub>i</sub>,X<sub>j</sub>)=K(X<sub>i</sub>,X<sub>i</sub>)+K(X<sub>j</sub>,X<sub>j</sub>)‑2K(X<sub>i</sub>,X<sub>j</sub>)数据的邻接矩阵按照上面的公式有K‑NN方法构造得到邻接矩阵W,即对D<sub>1</sub>和D<sub>T</sub>的每个样本X,按照上面公式计算距离X最近的K个样本点,X与这K个样本点用无向边分别连接,且边对应的权重值为两点的距离;最终得到一个无向图,所述无向图的邻接矩阵即为W;将矩阵W中每行元素相加作为矩阵D的对角元素,D的非对角线元素为0,则L=D‑W;S54.利用步骤S53得到的矩阵L,优化公式(e),最终得到分类器f<sup>*</sup>;S55.输入一个新的气体样本,采用步骤S1对样本进行预处理得到处理后的样本Z=(z<sub>1</sub>,z<sub>2</sub>,...,z<sub>N</sub>),利用步骤S22中的mean(D<sub>1</sub>)将Z中心化:即Z=Z‑mean(D<sub>1</sub>),计算f<sup>*</sup>(Z),如果f<sup>*</sup>(Z)&gt;0则新样本Z为待检测的气体,否则为其它气体。
地址 611731 四川省成都市高新区(西区)西源大道2006号