发明名称 一种物质气味嗅频提取方法
摘要 本发明公开了一种物质气味嗅频提取方法,给出了物质气味嗅频的定义;提出叠加降维算法(Superposition Mapping Analysis,SMA)对物质气味样品进行判别训练,结合物质气味化学配比表,以后序遍历规则的平衡二叉树为存储结构,建立物质气味样品属性库,对未知物质气味进行识别;构建物质气味成分比例及浓度模型对物质气味实现浓度实时提取。本发明提供了一种利用仿生嗅觉系统提取物质气味嗅频的方法,具有快速检测、高效准确、性能稳定等优点,为实现物质气味远距离网络传输提供前提基础。
申请公布号 CN104102818B 申请公布日期 2017.02.15
申请号 CN201410290577.0 申请日期 2014.06.24
申请人 广东工业大学 发明人 骆德汉;孙运龙
分类号 G06F19/00(2011.01)I 主分类号 G06F19/00(2011.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 一种物质气味嗅频提取方法,其特征在于,物质气味嗅频是指用于表征物质气味的特征信息,包含物质气味的种类名称记为R<sub>n</sub>,成分记为L<sub>c</sub>,比例浓度记为P<sub>i</sub>,对于嗅频的提取按照以下步骤进行:步骤1:选取物质气味样品备用,样品备份为若干份,固体每份为M克、液体每份为M毫升、气体为M立方毫米,固体物质研磨成粉末或切割成体积小于1立方毫米的块状,气体和液体物质密度均匀;样品置于恒温恒湿的实验箱中静置70分钟;步骤2:应用仿生嗅觉系统对已知物质气味样品进行采集检测,测量时间t为100秒,采集速率为7.749毫升/分钟,保存所测数据F<sub>s</sub>(S<sub>1</sub>,S<sub>2</sub>,…,S<sub>N</sub>),并对F<sub>s</sub>保存至计算机;步骤3:对步骤2中采集所得到的测量数据信息采用叠加映射降维算法SMA进行判断训练,并将所建立的样本序号O<sub>SMA</sub>与气味名称成分属性L(O<sub>name,</sub>C<sub>n1</sub>,C<sub>n2</sub>,…,C<sub>nk</sub>),其中O<sub>name</sub>是物质气味种类名称,C<sub>n1</sub>是物质气味第1种成分名称,C<sub>n2</sub>是物质气味第2种成分名称,C<sub>nk</sub>是物质气味第k种成分名称;以R(O<sub>SMA</sub>,O<sub>name</sub>,C<sub>n1</sub>,C<sub>n2</sub>,…,C<sub>nk</sub>)为结点的后序遍历规则的平衡二叉树形式保存至气味成分信息库;所述步骤3中使用的叠加映射降维方法,具体步骤如下:步骤1):将采集并测量得到的一个气味样本数据信息矩阵F<sub>s</sub>向量化,选取其中达到稳态响应值的测量值,组成训练样本矩阵<img file="FDA0001101738200000011.GIF" wi="468" he="102" />P<sub>T</sub>∈R<sup>r×n</sup>,<img file="FDA0001101738200000012.GIF" wi="254" he="86" />其中r代表训练样本矩阵的行数,由选取的样本类,样本个数及稳态时间值个数决定,j代表训练样本类别个数,j∈[1,c],i代表第j类训练样本个数,i∈[1,n<sub>i</sub>];则训练样本的均值为<maths num="0001"><math><![CDATA[<mrow><mi>&mu;</mi><mo>=</mo><msubsup><mi>&Sigma;t</mi><mi>j</mi><mi>i</mi></msubsup><mo>/</mo><msub><mi>&Sigma;n</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000013.GIF" wi="1502" he="143" /></maths>步骤2):由步骤1)设获取训练样本去均值后形成的样本矩阵为T=P<sub>T</sub>‑μ,T∈R<sup>r×n</sup>则T的协方差矩阵为Q=T×T<sup>T</sup>,Q∈R<sup>r×r</sup>                               (4)其中T<sup>T</sup>是T的转置矩阵,并计算Q矩阵的特征值及特征向量,按特征值累计贡献率不小于99.5%,从大到小顺序选取前a个特征值所对应的特征向量组成第一降维特征系数矩阵P<sub>c</sub>,P<sub>c</sub>∈R<sup>a×n</sup>,a≤n‑1,并将训练样本矩阵T投影到P<sub>c</sub>中,得到第一降维识别矩阵:P<sub>f</sub>=T×P<sub>c</sub><sup>T</sup>,P<sub>f</sub>∈R<sup>r×a</sup>                              (5)其中P<sub>c</sub><sup>T</sup>是P<sub>c</sub>的转置矩阵;步骤3):将第一降维识别矩阵P<sub>f</sub>作为第二降维的输入矩阵,即<img file="FDA0001101738200000021.GIF" wi="582" he="86" />P<sub>f</sub>∈R<sup>r×a</sup>,<img file="FDA0001101738200000022.GIF" wi="262" he="75" />其中k代表新训练样本矩阵的类别数k∈[1,c′],m代表每个训练样本的个数m∈[1,a],则<img file="FDA0001101738200000023.GIF" wi="59" he="63" />的样本矩阵均值矩阵为<img file="FDA0001101738200000024.GIF" wi="405" he="101" />训练的总样本P<sub>f</sub>的均值矩阵<img file="FDA0001101738200000025.GIF" wi="373" he="151" />μ<sub>c</sub>∈R<sup>1×a</sup>,υ∈R<sup>1×a</sup>,并计算P<sub>f</sub>类内散布矩阵S<sub>ω</sub>和类间散布矩阵S<sub>b</sub>,即<maths num="0002"><math><![CDATA[<mrow><msub><mi>S</mi><mi>&omega;</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>a</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><msup><mi>c</mi><mo>&prime;</mo></msup></munderover><msup><mrow><mo>(</mo><msubsup><mi>V</mi><mi>k</mi><mi>m</mi></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>c</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>&times;</mo><mrow><mo>(</mo><msubsup><mi>V</mi><mi>k</mi><mi>m</mi></msubsup><mo>-</mo><msub><mi>&mu;</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>,</mo><msub><mi>S</mi><mi>&omega;</mi></msub><mo>&Element;</mo><msup><mi>R</mi><mrow><mi>a</mi><mo>&times;</mo><mi>a</mi></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000026.GIF" wi="1558" he="167" /></maths><maths num="0003"><math><![CDATA[<mrow><msub><mi>S</mi><mi>b</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>a</mi></munderover><msup><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>c</mi></msub><mo>-</mo><mi>&upsi;</mi><mo>)</mo></mrow><mi>T</mi></msup><mo>&times;</mo><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>c</mi></msub><mo>-</mo><mi>&upsi;</mi><mo>)</mo></mrow><mo>,</mo><msub><mi>S</mi><mi>b</mi></msub><mo>&Element;</mo><msup><mi>R</mi><mrow><mi>a</mi><mo>&times;</mo><mi>a</mi></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000027.GIF" wi="1550" he="159" /></maths>则根据Fisher准则函数<maths num="0004"><math><![CDATA[<mrow><msub><mi>J</mi><mi>F</mi></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msup><mi>&omega;</mi><mi>T</mi></msup><msub><mi>S</mi><mi>b</mi></msub><mi>&omega;</mi></mrow><mrow><msup><mi>&omega;</mi><mi>T</mi></msup><msub><mi>S</mi><mi>&omega;</mi></msub><mi>&omega;</mi></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000028.GIF" wi="1549" he="175" /></maths>由式(8)可知,当选取的矢量ω使J<sub>F</sub>(ω)取最大值时具有最优分析,其物理意义为以ω为投影方向,投影后的样本空间具有最大的类间离散度和最小的类内离散度;则可对式(8)应用拉格朗日乘法,设其存在特征根λ,λ是最优解即最佳投影矩阵,则有J<sub>F</sub>(ω)=ω<sup>T</sup>S<sub>b</sub>ω‑λ(ω<sup>T</sup>S<sub>ω</sub>ω‑1)                          (9)则对式(9)等号两边同时对ω求导,可得<maths num="0005"><math><![CDATA[<mrow><mfrac><mrow><msub><mi>d</mi><msub><mi>J</mi><mi>F</mi></msub></msub><mrow><mo>(</mo><mi>&omega;</mi><mo>)</mo></mrow></mrow><mrow><mi>d</mi><mi>&omega;</mi></mrow></mfrac><mo>=</mo><mn>2</mn><msub><mi>S</mi><mi>b</mi></msub><mi>&omega;</mi><mo>-</mo><mn>2</mn><msub><mi>&lambda;S</mi><mi>&omega;</mi></msub><mi>&omega;</mi><mo>=</mo><mn>0</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000031.GIF" wi="1574" he="183" /></maths>则有S<sub>b</sub>ω=λS<sub>ω</sub>ω                                    (11)继而得到<img file="FDA0001101738200000032.GIF" wi="1352" he="87" />则对于λ的求解即可转化为求解特征矩阵<img file="FDA0001101738200000033.GIF" wi="166" he="78" />的特征向量,由于S<sub>ω</sub>∈R<sup>a×a</sup>且S<sub>b</sub>∈R<sup>a×a</sup>,所以求得S<sub>ω</sub><sup>‑1</sup>S<sub>b</sub>的特征向量L<sub>c</sub>,L<sub>c</sub>∈R<sup>a×a</sup>,用来构建第二降维特征系数矩阵,最终获得叠加映射特征系数矩阵C=L<sub>c</sub>×P<sub>c</sub>,C∈R<sup>a×n</sup>                                (13)则其训练样本的叠加映射算法识别特征矩阵为:C<sub>f</sub>=T×C<sup>T</sup> C<sub>f</sub>∈R<sup>r×a</sup>,                              (14)再依据欧式距离判别式<img file="FDA0001101738200000034.GIF" wi="470" he="157" />来判别n维空间的中样本点间的相似度;步骤4:输入未知物质气味样品,应用仿生嗅觉系统采集气味样品,并采用SMA算法对未知物质气味进行判别分析获得样本序号O<sub>SMA</sub>′,并在已建立的后序遍历规则的平衡二叉树内进行查找,若找到与之匹配的O<sub>SMA</sub>,则输出R(O<sub>SMA</sub>,O<sub>name</sub>,C<sub>n1</sub>,C<sub>n2</sub>,…,C<sub>nk</sub>),若找不到与之匹配的O<sub>SMA</sub>,则返回无此信息;同时对测量值进行成分比例计算P(T<sub>n1</sub>,T<sub>n2</sub>,…,T<sub>nk</sub>),T<sub>n1</sub>是第1种成分所占比例,T<sub>n2</sub>是第2种成分所占比例,T<sub>nk</sub>是第k种成分所占比例,其计算公式为<maths num="0006"><math><![CDATA[<mrow><msub><mi>T</mi><mrow><mi>n</mi><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mrow><mi>A</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mi>A</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000041.GIF" wi="1501" he="213" /></maths>A(i)是k种成分对应传感器测量平均值,<img file="FDA0001101738200000042.GIF" wi="174" he="143" />是第1种成分至第k种成分的测量平均值加权和;则物质气味浓度为<maths num="0007"><math><![CDATA[<mrow><msub><mi>P</mi><mi>i</mi></msub><mo>=</mo><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mi>A</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>&CenterDot;</mo><msub><mi>T</mi><mrow><mi>n</mi><mi>i</mi></mrow></msub></mrow><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></munderover><mi>A</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>&times;</mo><mfrac><msup><mi>V</mi><mo>&prime;</mo></msup><mi>V</mi></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001101738200000043.GIF" wi="1517" he="302" /></maths>其中V′是采集预压缩后的气味体积,V是采集的原始气味体积;步骤5:依据步骤4中所得R(O<sub>SMA</sub>,O<sub>name</sub>,C<sub>n1</sub>,C<sub>n2</sub>,…,C<sub>nk</sub>)可以求知物质气味的名称R<sub>n</sub>及成分L<sub>c</sub>,所得P(T<sub>n1</sub>,T<sub>n2</sub>,…,T<sub>nk</sub>)可知气味的成分比例及浓度P<sub>i</sub>,则可得到物质气味嗅频。
地址 510006 广东省广州市番禺区广州大学城外环西路100号