发明名称 基于多层增强HMM的语音-视觉融合的情感识别方法
摘要 本发明提出的一种基于多层增强HMM(MBHMM)的语音-视觉融合的情感识别方法,属于自动情感识别领域。本发明方法中提出的MBHMM分类器包括3层整体分类器,每层整体分类器由从左向右的多个连续型HMM分量分类器组合而成。使用情绪视频中的语音、脸部表情、肩部运动三种特征流分别作为3层整体分类器的输入,在训练整体分类器时通过AdaBoost方法不断更新各样本的权重,同时通过AdaBoost方法确保在使用某一特征流训练当前层整体分类器时着重于前一特征流的整体分类器难于识别的样本。本发明方法与已有识别方法相比较明显提高了分类的准确度。
申请公布号 CN102930298B 申请公布日期 2015.04.29
申请号 CN201210459172.6 申请日期 2012.11.15
申请人 北京理工大学 发明人 吕坤;贾云得;邹文泽;张欣
分类号 G06K9/62(2006.01)I;G06K9/66(2006.01)I;G06K9/00(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 代理人
主权项 一种多层增强HMM的语音‑视觉融合的情感识别方法,用于识别情感视频中的人的情感,所述情感包括:中性、高兴、生气、惊讶、恐惧、悲伤、厌恶;所述情感视频是指包含人脸表情、肩部运动和语音的视频数据,并且每段情感视频都开始于中性表情;其特征在于:所述多层增强HMM的语音‑视觉融合的情感识别方法包括2部分:训练过程和识别过程;所述训练过程的具体实施步骤如下:步骤一、对训练数据中的情感视频数据进行预处理;将每一种情感的训练数据称为一个训练样本集;一个训练样本集中的训练样本数量用R表示,R≥20;分别对每个训练样本集中的每个情感视频数据做预处理,得到表情观察向量序列、肩部观察向量序列和音频观察向量序列;一个训练样本集中的全部情感视频数据在预处理后,得到的表情观察向量序列的集合称为表情特征数据流,得到的肩部观察向量序列的集合称为肩部特征数据流,得到的音频观察向量序列的集合称为音频特征数据流,这三种特征数据流用符号X<sup>v</sup>表示,<img file="FDA0000662388180000011.GIF" wi="317" he="132" />v∈{a,f,s};其中,a表示音频,f表示表情,s表示肩部;<img file="FDA0000662388180000012.GIF" wi="69" he="82" />表示v特征数据流中的第r个音频观察向量序列、表情观察向量序列和肩部观察向量序列,即:<img file="FDA0000662388180000013.GIF" wi="76" he="80" />表示音频特征数据流中第r个音频特征观察序列,<img file="FDA0000662388180000014.GIF" wi="77" he="89" />表示表情特征数据流中第r个表情特征观察序列,<img file="FDA0000662388180000015.GIF" wi="71" he="84" />表示肩部特征数据流中第r个肩部运动特征观察序列<img file="FDA0000662388180000016.GIF" wi="94" he="84" />1≤r≤R;所述对每个训练样本集中的每个情感视频数据做预处理,得到表情观察向量序列和肩部观察向量序列的具体步骤为:第1步:从每个情感视频中以v<sub>a</sub>的采样率提取m帧图像组成一个图像序列,v<sub>a</sub>≥5赫兹,m=v<sub>a</sub>×t<sub>a</sub>,t<sub>a</sub>为情感视频的时间长度;第2步:依次从每个图像序列中的各帧图像中提取θ个脸部表情特征值,分别用T<sub>1</sub>至T<sub>θ</sub>表示,θ≥5;所述脸部表情特征值包括:脸部几何特征值;脸部纹理特征值;第3步:为了解决因不同人脸型不同造成的对脸部表情特征值T<sub>1</sub>至T<sub>θ</sub>的影响,对所有图像的脸部表情特征值T<sub>1</sub>至T<sub>θ</sub>进行归一化处理,具体为:第3.1步:从全部图像序列中找出包含待处理图像中人脸的所有图像序列;所述待处理图像为当前等待做归一化处理的图像;第3.2步:分别计算经过第3.1步处理后得到的包含待处理图像中人脸的所有图像序列的第一帧图像中脸部表情特征值T<sub>1</sub>的均值、T<sub>2</sub>的均值、……、T<sub>θ</sub>的均值,分别用<img file="FDA00006623881800000210.GIF" wi="51" he="77" />至<img file="FDA00006623881800000211.GIF" wi="63" he="72" />表示;第3.3步:用T<sub>1</sub>对待处理图像的脸部表情特征值T<sub>1</sub>进行归一化处理,归一化处理后的脸部表情特征值T<sub>1</sub>用符号T′<sub>1</sub>表示,<img file="FDA0000662388180000021.GIF" wi="238" he="90" />用<img file="FDA0000662388180000022.GIF" wi="55" he="86" />对待处理图像的脸部表情特征值T<sub>2</sub>进行归一化处理,归一化处理后的脸部表情特征值T<sub>2</sub>用符号T′<sub>2</sub>表示,<img file="FDA0000662388180000023.GIF" wi="257" he="87" />……;以此类推,用<img file="FDA0000662388180000024.GIF" wi="63" he="79" />对待处理图像的脸部表情特征值T<sub>θ</sub>进行归一化处理,归一化处理后的脸部表情特征值T<sub>θ</sub>用符号T′<sub>θ</sub>表示,<img file="FDA0000662388180000025.GIF" wi="263" he="84" />第4步:获得每个图像序列中各帧图像的表情观察向量,用V<sub>q</sub>表示,1≤q≤m;一个图像序列中第q帧图像的表情观察向量V<sub>q</sub>由经过第3步归一化处理后的θ个特征值组成,V<sub>q</sub>=[f<sub>q1</sub>,f<sub>q2</sub>,……,f<sub>qθ</sub>]<sup>T</sup>,f<sub>q1</sub>为该图像序列的第q帧图像中经过归一化处理的第1个脸部表情特征值T′<sub>1</sub>,f<sub>q2</sub>为该图像序列的第q帧图像中经过归一化处理的第2个脸部表情特征值T′<sub>2</sub>,……,以此类推,f<sub>qθ</sub>为该图像序列的第q帧图像中经过归一化处理的第θ个脸部表情特征值T′<sub>θ</sub>;第5步:对于一个情感视频,使用矩阵M来表示其表情观察向量序列,M=[V<sub>1</sub>,V<sub>2</sub>,……,V<sub>m</sub>]∈R<sup>θ×m</sup>;第6步:依次从每个图像序列中的各帧图像中提取δ个肩部运动特征值,分别用L<sub>1</sub>至L<sub>δ</sub>表示,δ≥5;第7步:为了解决因不同人体型不同造成的对肩部运动特征值L<sub>1</sub>至L<sub>δ</sub>的影响,对所有图像的肩部运动特征值L<sub>1</sub>至L<sub>δ</sub>进行归一化处理,具体为:第7.1步:从全部图像序列中找出包含待处理图像中人脸的所有图像序列;所述待处理图像为当前等待做归一化处理的图像;第7.2步:分别计算经过第7.1步处理后得到的包含待处理图像中人脸的所有图像序列的第一帧图像中肩部运动特征值L<sub>1</sub>的均值、L<sub>2</sub>的均值、……、L<sub>δ</sub>的均值,分别用<img file="FDA0000662388180000026.GIF" wi="63" he="80" />至<img file="FDA0000662388180000027.GIF" wi="62" he="79" />表示;第7.3步:用<img file="FDA00006623881800000215.GIF" wi="58" he="72" />对待处理图像的肩部运动特征值L<sub>1</sub>进行归一化处理,归一化处理后的肩部运动特征值L<sub>1</sub>用符号L′<sub>1</sub>表示,<img file="FDA00006623881800000212.GIF" wi="251" he="90" />用<img file="FDA0000662388180000029.GIF" wi="70" he="72" />对待处理图像的肩部运动特征值L<sub>2</sub>进行归一化处理,归一化处理后的肩部运动特征值L<sub>2</sub>用符号L′<sub>2</sub>表示,<img file="FDA00006623881800000213.GIF" wi="277" he="95" />……;以此类推,用<img file="FDA00006623881800000214.GIF" wi="72" he="77" />对待处理图像的肩部运动特征值L<sub>δ</sub>进行归一化处理,归一化处理后的肩部运动特征值L<sub>δ</sub>用符号L′<sub>δ</sub>表示,<img file="FDA0000662388180000031.GIF" wi="285" he="95" />第8步:获得每个图像序列中各帧图像的肩部观察向量,用V″<sub>q</sub>表示,1≤q≤m;一个图像序列中第q帧图像的肩部观察向量V″<sub>q</sub>由经过第7步归一化处理后的δ个肩部运动特征值组成,V″<sub>q</sub>=[f″<sub>q1</sub>,f″<sub>q2</sub>,……,f″<sub>qδ</sub>]<sup>T</sup>,f″<sub>q1</sub>为该图像序列的第q帧图像中经过归一化处理的第1个肩部运动特征值L′<sub>1</sub>,f″<sub>q2</sub>为该图像序列的第q帧图像中经过归一化处理的第2个肩部运动特征值L′<sub>2</sub>,……,以此类推,f″<sub>qδ</sub>为该图像序列的第q帧图像中经过归一化处理的第δ个肩部运动特征值L′<sub>δ</sub>;第9步:对于一个情感视频,使用矩阵M″来表示其肩部观察向量序列,M″=[V″<sub>1</sub>,V″<sub>2</sub>,……,V″<sub>m</sub>]∈R<sup>δ×m</sup>;步骤一中所述对每个训练样本集中的每个情感视频数据做预处理,得到音频观察向量序列的具体步骤为:步骤a:从每个情感视频中以v<sub>b</sub>的采样率提取p个音频帧组成一条音频序列,v<sub>b</sub>≥5赫兹,p=v<sub>b</sub>×t<sub>a</sub>;步骤b:依次从每条音频序列的各音频帧中提取α个音频特征值,分别用F<sub>1</sub>~F<sub>α</sub>表示,α≥4;所述音频特征值包括:信号强度;短时过零率;基音频率;共振峰频率;线性预测倒谱系数;线谱对参数;Mel频率倒谱系数;感知线性预测倒谱系数;步骤c:对所有音频帧的音频特征值F<sub>1</sub>~F<sub>α</sub>进行归一化处理,具体为:步骤c.1:找出与待处理音频帧为同一发声人物的所有中性情感的音频序列;所述待处理音频帧为当前等待做归一化处理的音频帧;步骤c.2:分别计算经过步骤c.1处理后得到的与待处理音频帧为同一发声人物的所有中性情感的音频序列中各音频帧的音频特征值F<sub>1</sub>的均值、F<sub>2</sub>的均值、……、F<sub>α</sub>的均值,分别用<img file="FDA0000662388180000033.GIF" wi="58" he="77" />至<img file="FDA0000662388180000034.GIF" wi="72" he="82" />表示;步骤c.3:用<img file="FDA0000662388180000035.GIF" wi="58" he="82" />对待处理音频帧的音频特征值F<sub>1</sub>进行归一化处理,归一化处理后的音频特征值F<sub>1</sub>用符号F′<sub>1</sub>表示,<img file="FDA0000662388180000032.GIF" wi="260" he="96" />用<img file="FDA0000662388180000036.GIF" wi="70" he="82" />对待处理音频帧的音频特征值F<sub>2</sub>进行归一化处理,归一化处理后的音频特征值F<sub>2</sub>用符号F′<sub>2</sub>表示,<img file="FDA0000662388180000037.GIF" wi="271" he="95" />……;以此类推,用<img file="FDA0000662388180000038.GIF" wi="71" he="77" />对待处理音频帧的音频特征值F<sub>α</sub>进行归一化处理,归一化处理后的音频特征值F<sub>α</sub>用符号F′<sub>α</sub>表示,<img file="FDA0000662388180000039.GIF" wi="302" he="101" />步骤d:获得每个音频序列中各音频帧的音频观察向量,用V′<sub>t</sub>表示,1≤t≤p;一个音频序列中的第t帧音频帧的音频观察向量V′<sub>t</sub>由经过归一化处理后的α个特征值组成,V′<sub>t</sub>=[f′<sub>t1</sub>,f′<sub>t2</sub>,……,f′<sub>tα</sub>]<sup>T</sup>,f′<sub>t1</sub>为该音频序列的第t帧音频帧中经过归一化处理的第1个音频特征值F′<sub>1</sub>,f′<sub>t2</sub>为该音频序列的第t帧音频帧中经过归一化处理的第2个音频特征值F′<sub>2</sub>,……,以此类推,f′<sub>tα</sub>为该音频序列的第t帧音频帧中经过归一化处理的第α个音频特征值F′<sub>α</sub>;步骤f:对于一个情感视频,使用矩阵M′来表示其音频观察向量序列,M′=[V′<sub>1</sub>,V′<sub>2</sub>,……,V′<sub>p</sub>]∈R<sup>α×p</sup>;步骤二、建立MBHMM分类器;在步骤一操作的基础上,建立MBHMM分类器;所述MBHMM分类器包括第1层整体分类器、第2层整体分类器和第3层整体分类器;每层整体分类器由从左向右的K′个连续型HMM分量分类器组合而成,1≤K′≤K,K的值由人为预先设定,4≤K≤10;三层整体分类器中连续型HMM分量分类器的模型参数表示为λ={N,A,w<sub>i,d</sub>,μ<sub>i,d</sub>,U<sub>i,d</sub>,π};其中,N表示模型的状态数;π表示状态初始概率;A为状态转移概率矩阵,A={a<sub>i,j</sub>},1≤i,j≤N,a<sub>i,j</sub>表示从状态S<sub>i</sub>转移到状态S<sub>j</sub>的概率;用S={S<sub>1</sub>,S<sub>2</sub>,……,S<sub>N</sub>}表示状态集合,S<sub>i</sub>=i;观察概率密度函数为混合高斯密度函数,如公式(1)所示;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>b</mi><msup><mi>t</mi><mo>&prime;</mo></msup></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>d</mi><mo>=</mo><mn>1</mn></mrow><mi>D</mi></munderover><msub><mi>w</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mi>N</mi><mrow><mo>(</mo><msub><mi>O</mi><msup><mi>t</mi><mo>&prime;</mo></msup></msub><mo>,</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>,</mo><msub><mi>U</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000041.GIF" wi="1859" he="141" /></maths>其中,b<sub>t′</sub>(i)表示t′时刻状态为S<sub>i</sub>时的观察概率密度函数;O<sub>t′</sub>是t′时刻的观察向量,即样本在t′时刻的表情观察向量或肩部观察向量或音频观察向量;N(O<sub>t′</sub>,μ<sub>i,d</sub>,U<sub>i,d</sub>)表示状态S<sub>i</sub>的第d个高斯概率密度函数,1≤d≤D,D为混合高斯密度函数的混合数,2≤D≤5;w<sub>i,d</sub>,μ<sub>i,d</sub>,U<sub>i,d</sub>分别表示状态S<sub>i</sub>的第d个高斯概率密度函数的混合权重、均值向量和协方差矩阵;第1层整体分类器和第2层整体分类器中的连续型HMM分量分类器的状态数N=5;第3层整体分类器中的连续型HMM分量分类器的状态数N=3;当N=5时,设定π为[1 0 0 0 0],同时设定状态转移概率矩阵A的初值为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000662388180000051.GIF" wi="649" he="429" /></maths>当N=3时,设定π为[1 0 0],同时设定状态转移概率矩阵A的初值为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0.5</mn></mtd><mtd><mn>0.5</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000662388180000052.GIF" wi="397" he="260" /></maths>设定高斯概率密度函数的混合权重w<sub>i,d</sub>的初始值为<img file="FDA0000662388180000053.GIF" wi="94" he="127" />高斯概率密度函数的协方差矩阵U<sub>i,d</sub>的初始值是一个行数和列数均为P的对角协方差矩阵:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0.25</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0.25</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0.25</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mo>.</mo><mo>.</mo><mo>.</mo></mtd><mtd><mn>0.25</mn></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000662388180000054.GIF" wi="737" he="427" /></maths>当观察向量O<sub>t′</sub>是表情观察向量时,P=θ;当观察向量O<sub>t′</sub>是肩部观察向量时,P=δ;当观察向量O<sub>t′</sub>是音频观察向量时,P=α;高斯概率密度函数的均值向量μ<sub>i,d</sub>的初始值产生方法为:将输入观察序列分成N段,然后用K均值聚类算法产生高斯概率密度函数的均值向量μ<sub>i,d</sub>的初始值;步骤三、训练MBHMM分类器;在步骤二操作的基础上,同时训练C个MBHMM分类器,C表示情感类别的数量;即:对应每一种情感,训练一个MBHMM分类器;用φ<sub>c</sub>表示第c种情感对应的MBHMM分类器,1≤c≤C;使用第c种情感的训练样本集对MBHMM分类器φ<sub>c</sub>进行训练的过程为:步骤1:使用变量L,并设定变量L的初始值为1,然后执行步骤2至步骤11的操作;步骤2:用<img file="FDA0000662388180000055.GIF" wi="77" he="77" />表示MBHMM分类器φ<sub>c</sub>中第L层整体分类器,用W<sub>L</sub>(r)表示输入到整体分类器<img file="FDA0000662388180000061.GIF" wi="74" he="78" />的特征数据流X<sup>v</sup>中的第r个观察向量序列<img file="FDA0000662388180000062.GIF" wi="64" he="81" />的权重;当L=1时,将带有权重W<sub>L</sub>(r)的音频特征数据流X<sup>a</sup>输入到整体分类器<img file="FDA0000662388180000063.GIF" wi="105" he="80" />W<sub>L</sub>(r)=1/R;当L=2时,将带有权重W<sub>L</sub>(r)的表情特征数据流X<sup>f</sup>输入到整体分类器<img file="FDA0000662388180000064.GIF" wi="96" he="79" />当L=3时,将带有权重W<sub>L</sub>(r)的肩部特征数据流X<sup>s</sup>输入到整体分类器<img file="FDA0000662388180000065.GIF" wi="108" he="70" />步骤3:用<img file="FDA0000662388180000066.GIF" wi="76" he="81" />表示整体分类器<img file="FDA0000662388180000067.GIF" wi="76" he="78" />中包含的连续型HMM分量分类器的个数,并设定<img file="FDA0000662388180000068.GIF" wi="79" he="83" />的初始值为K;使用变量k,并设定变量k的初始值为1;然后执行步骤4至步骤10的操作;步骤4:用<img file="FDA0000662388180000069.GIF" wi="107" he="99" />表示整体分类器<img file="FDA00006623881800000610.GIF" wi="80" he="78" />中的第k个连续型HMM分量分类器;将步骤2中所述输入到整体分类器<img file="FDA00006623881800000611.GIF" wi="75" he="74" />中的特征数据流X<sup>v</sup>输入到连续型HMM分量分类器<img file="FDA00006623881800000612.GIF" wi="112" he="97" />中,该特征数据流中的第r个观察向量序列<img file="FDA00006623881800000613.GIF" wi="66" he="78" />的权重为w<sub>k</sub>(r),1≤r≤R;当k=1时,w<sub>k</sub>(r)=W<sub>L</sub>(r);步骤5:使用EM算法迭代调整步骤4中所述连续型HMM分量分类器<img file="FDA00006623881800000614.GIF" wi="108" he="95" />的模型参数,得到连续型HMM分量分类器<img file="FDA00006623881800000615.GIF" wi="111" he="94" />的最优模型参数,其具体操作为:步骤5.1:通过公式(2)计算所述连续型HMM分量分类器<img file="FDA00006623881800000616.GIF" wi="107" he="98" />中各观察向量序列<img file="FDA00006623881800000617.GIF" wi="62" he="74" />的前向概率,1≤r≤R;<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>a</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>1</mn></msub></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>b</mi><msub><mi>t</mi><mn>1</mn></msub></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>&Sigma;</mi><mi>j</mi></msub><msub><mi>a</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>1</mn></msub><mo>-</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000618.GIF" wi="1897" he="104" /></maths>其中,<img file="FDA00006623881800000629.GIF" wi="155" he="85" />表示连续型HMM分量分类器<img file="FDA00006623881800000619.GIF" wi="108" he="97" />在t<sub>1</sub>时刻处于状态S<sub>i</sub>,并且从第1时刻到t<sub>1</sub>时刻出现<img file="FDA00006623881800000630.GIF" wi="341" he="76" />的概率,也称为前向概率;2≤t<sub>1</sub>≤T<sub>r</sub>;当L=1时,T<sub>r</sub>=p;当L=2或3时,T<sub>r</sub>=m;α<sub>r,1</sub>(i)=πb<sub>1</sub>(i);<img file="FDA00006623881800000631.GIF" wi="341" he="86" />表示第r个样本在第1时刻至t<sub>1</sub>时刻的观察向量;步骤5.2:通过公式(3)计算所述连续型HMM分量分类器<img file="FDA00006623881800000620.GIF" wi="110" he="101" />中各观察向量序列<img file="FDA00006623881800000621.GIF" wi="60" he="75" />的后向概率;<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub></mrow></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>&Sigma;</mi><mi>i</mi></msub><msub><mi>b</mi><mrow><msub><mi>t</mi><mn>2</mn></msub><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>a</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000622.GIF" wi="1901" he="95" /></maths>其中,<img file="FDA00006623881800000632.GIF" wi="178" he="92" />表示连续型HMM分量分类器<img file="FDA00006623881800000623.GIF" wi="101" he="91" />在t<sub>2</sub>时刻处于状态S<sub>j</sub>,并且从(t<sub>2</sub>+1)时刻到T<sub>r</sub>时刻出现<img file="FDA00006623881800000633.GIF" wi="279" he="80" />的概率,也称为后向概率;1≤t<sub>2</sub>≤T<sub>r</sub>‑1;当L=1时,T<sub>r</sub>=p;当L=2或3时,T<sub>r</sub>=m;<img file="FDA00006623881800000627.GIF" wi="257" he="92" /><img file="FDA00006623881800000628.GIF" wi="426" he="79" />表示第r个样本在第(t<sub>2</sub>+1)时刻至T<sub>r</sub>时刻的观察向量;步骤5.3:通过公式(4)计算所述连续型HMM分量分类器<img file="FDA00006623881800000624.GIF" wi="108" he="100" />中各观察向量序列<img file="FDA00006623881800000625.GIF" wi="73" he="77" />的概率P<sub>r</sub>;<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msub><mi>P</mi><mi>r</mi></msub><mo>=</mo><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><mi>p</mi></mrow></msub><mrow><mo>(</mo><msubsup><mi>q</mi><msub><mi>T</mi><mi>r</mi></msub><mi>L</mi></msubsup><mo>)</mo></mrow><mo>=</mo><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><msubsup><mi>q</mi><mn>1</mn><mi>L</mi></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000626.GIF" wi="1897" he="108" /></maths>其中,<img file="FDA0000662388180000071.GIF" wi="69" he="91" />表示连续型HMM分量分类器<img file="FDA0000662388180000072.GIF" wi="102" he="97" />在T<sub>r</sub>时刻的状态取值;当L=1时,T<sub>r</sub>=p;当L=2或3时,T<sub>r</sub>=m;<img file="FDA0000662388180000073.GIF" wi="68" he="82" />表示连续型HMM分量分类器<img file="FDA0000662388180000074.GIF" wi="107" he="95" />在初始时刻的状态取值;步骤5.4:使用公式(5)至公式(9),利用各观察向量序列<img file="FDA00006623881800000713.GIF" wi="64" he="76" />在步骤5.1中得到的前向概率<img file="FDA0000662388180000075.GIF" wi="184" he="84" />步骤5.2中得到的后向概率<img file="FDA0000662388180000076.GIF" wi="159" he="84" />和步骤5.3得到的观察向量序列的概率P<sub>r</sub>重估连续型HMM分量分类器<img file="FDA0000662388180000077.GIF" wi="110" he="92" />的模型参数A、w<sub>i,d</sub>、μ<sub>i,d</sub>和U<sub>i,d</sub>;<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mi>i</mi></msub><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow></mfrac><mo>&times;</mo><mfrac><mrow><msub><mi>w</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mi>N</mi><mrow><mo>(</mo><msub><mi>O</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mo>,</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>,</mo><msub><mi>U</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>)</mo></mrow></mrow><mrow><munderover><mi>&Sigma;</mi><mrow><msup><mi>d</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1</mn></mrow><mi>D</mi></munderover><msub><mi>w</mi><mrow><mi>i</mi><mo>,</mo><msup><mi>d</mi><mo>&prime;</mo></msup></mrow></msub><mi>N</mi><mrow><mo>(</mo><msub><mi>O</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mo>,</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><msup><mi>d</mi><mo>&prime;</mo></msup></mrow></msub><mo>,</mo><msub><mi>U</mi><mrow><mi>i</mi><mo>,</mo><msup><mi>d</mi><mo>&prime;</mo></msup></mrow></msub><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000078.GIF" wi="1885" he="234" /></maths>其中,ξ<sub>r,t′</sub>(i,d)表示第r个样本在t′时刻的观察向量O<sub>r,t′</sub>在连续型HMM分量分类器<img file="FDA00006623881800000714.GIF" wi="108" he="103" />的状态S<sub>i</sub>的第d个高斯密度函数下的概率;<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>w</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><munderover><mi>&Sigma;</mi><mrow><msup><mi>d</mi><mo>&prime;</mo></msup><mo>=</mo><mn>1</mn></mrow><mi>D</mi></munderover><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><msup><mi>d</mi><mo>&prime;</mo></msup><mo>)</mo></mrow><mo>]</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000079.GIF" wi="1904" he="292" /></maths>其中,ξ<sub>r,t′</sub>(i,d′)表示第r个样本在t′时刻的观察向量O<sub>r,t′</sub>在连续型HMM分量分类器<img file="FDA00006623881800000715.GIF" wi="113" he="98" />的状态S<sub>i</sub>的第d′个高斯密度函数下的概率;<maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><msub><mi>O</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mo>]</mo></mrow><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>]</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000710.GIF" wi="1901" he="300" /></maths><maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><msub><mi>U</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>=</mo><mfrac><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mrow><mo>(</mo><msub><mi>O</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mo>-</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>O</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mo>-</mo><msub><mi>&mu;</mi><mrow><mi>i</mi><mo>,</mo><mi>d</mi></mrow></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>]</mo></mrow><mrow><munder><mi>&Sigma;</mi><mi>r</mi></munder><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>/</mo><mi>P</mi><mrow><mo>(</mo><msubsup><mi>x</mi><mi>v</mi><mi>r</mi></msubsup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><munder><mi>&Sigma;</mi><msup><mi>t</mi><mo>&prime;</mo></msup></munder><msub><mi>&xi;</mi><mrow><mi>r</mi><mo>,</mo><msup><mi>t</mi><mo>&prime;</mo></msup></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>d</mi><mo>)</mo></mrow><mo>]</mo></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000711.GIF" wi="1893" he="294" /></maths><maths num="0012" id="cmaths0012"><math><![CDATA[<mrow><msub><mi>a</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>=</mo><mfrac><mrow><msub><mi>&Sigma;</mi><mi>r</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>/</mo><msub><mi>P</mi><mi>r</mi></msub><mo>)</mo></mrow><msubsup><mi>&Sigma;</mi><mrow><msub><mi>t</mi><mn>2</mn></msub><mo>=</mo><mn>1</mn></mrow><mrow><msub><mi>T</mi><mi>r</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub></mrow></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>a</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><msub><mi>b</mi><mrow><msub><mi>t</mi><mn>2</mn></msub><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub><mo>+</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></mrow><mrow><msub><mi>&Sigma;</mi><mi>r</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>/</mo><msub><mi>P</mi><mi>r</mi></msub><mo>)</mo></mrow><msubsup><mi>&Sigma;</mi><mrow><msub><mi>t</mi><mn>2</mn></msub><mo>=</mo><mn>1</mn></mrow><mrow><msub><mi>T</mi><mi>r</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><msub><mi>&alpha;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub></mrow></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><msub><mi>&beta;</mi><mrow><mi>r</mi><mo>,</mo><msub><mi>t</mi><mn>2</mn></msub></mrow></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000712.GIF" wi="1880" he="204" /></maths>其中,当L=1时,T<sub>r</sub>=p;当L=2或3时,T<sub>r</sub>=m;步骤5.5:判断连续型HMM分量分类器<img file="FDA00006623881800000716.GIF" wi="108" he="98" />的模型参数A、w<sub>i,d</sub>、μ<sub>i,d</sub>和U<sub>i,d</sub>是否均收敛;如非均收敛,返回到步骤5.1;否则,则将步骤5.4得到的A、w<sub>i,d</sub>、μ<sub>i,d</sub>和U<sub>i,d</sub>以及步骤二设定的状态初始概率π作为连续型HMM分量分类器<img file="FDA0000662388180000081.GIF" wi="111" he="90" />的最优模型参数;步骤6:使用步骤4中所述输入到连续型HMM分量分类器<img file="FDA0000662388180000082.GIF" wi="103" he="99" />的特征数据流X<sup>v</sup>验证步骤5得到的连续型HMM分量分类器<img file="FDA0000662388180000083.GIF" wi="134" he="95" />具体验证方法为:用<img file="FDA0000662388180000084.GIF" wi="202" he="107" />表示观察向量序列<img file="FDA00006623881800000828.GIF" wi="65" he="77" />是否被连续型HMM分量分类器<img file="FDA0000662388180000085.GIF" wi="101" he="96" />正确分类,如果观察向量序列<img file="FDA0000662388180000086.GIF" wi="68" he="85" />被正确分类,设定<img file="FDA0000662388180000087.GIF" wi="294" he="111" />否则,设定<img file="FDA0000662388180000088.GIF" wi="327" he="99" />步骤7:通过公式(14)计算连续型HMM分量分类器<img file="FDA0000662388180000089.GIF" wi="104" he="92" />的训练误差,用<img file="FDA00006623881800000810.GIF" wi="116" he="91" />表示;<maths num="0013" id="cmaths0013"><math><![CDATA[<mrow><msubsup><mi>E</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>=</mo><munder><mi>&Sigma;</mi><mrow><msubsup><mi>h</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mn>1</mn></mrow></munder><msub><mi>w</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mtext>---</mtext><mrow><mo>(</mo><mn>14</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000811.GIF" wi="1899" he="149" /></maths>步骤8:使用变量k′,并设定k′=k+1;步骤9:通过公式(15)依次计算输入到第k′个连续型HMM分量分类器<img file="FDA00006623881800000829.GIF" wi="108" he="98" />的观察向量序列<img file="FDA00006623881800000830.GIF" wi="65" he="75" />的权重,用w<sub>k′</sub>(r)表示,1≤r≤R;<maths num="0014" id="cmaths0014"><math><![CDATA[<mrow><msub><mi>w</mi><msup><mi>k</mi><mo>&prime;</mo></msup></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mfrac><mrow><msub><mi>w</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow></mrow><msub><mi>Z</mi><msup><mi>k</mi><mo>&prime;</mo></msup></msub></mfrac><mo>&times;</mo><msup><mi>e</mi><mrow><mo>-</mo><msubsup><mi>h</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>&times;</mo><msub><mi>&delta;</mi><mi>k</mi></msub></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>15</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000812.GIF" wi="1897" he="156" /></maths>其中,Z<sub>k′</sub>是归一化因子,<maths num="0015" id="cmaths0015"><math><![CDATA[<mrow><msub><mi>Z</mi><msup><mi>k</mi><mo>&prime;</mo></msup></msub><mo>=</mo><munder><mi>&Sigma;</mi><mi>r</mi></munder><mrow><mo>(</mo><msub><mi>w</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mo>&times;</mo><msup><mi>e</mi><mrow><mo>-</mo><msubsup><mi>h</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>&times;</mo><msub><mi>&delta;</mi><mi>k</mi></msub></mrow></msup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA00006623881800000813.GIF" wi="646" he="149" /></maths><maths num="0016" id="cmaths0016"><math><![CDATA[<mrow><msub><mi>&delta;</mi><mi>k</mi></msub><mo>=</mo><mfrac><mrow><mi>ln</mi><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msubsup><mi>E</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow><mo>/</mo><msubsup><mi>E</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>]</mo></mrow><mn>2</mn></mfrac><mo>;</mo></mrow>]]></math><img file="FDA00006623881800000814.GIF" wi="567" he="177" /></maths>步骤10:如果此时k≠K,并且<img file="FDA00006623881800000827.GIF" wi="113" he="98" />的值不大于某一预先设定值σ,0<σ≤0.5,则令k=k′,w<sub>k</sub>(r)=w<sub>k′</sub>(r),然后返回到步骤4;否则,得到整体分类器<img file="FDA00006623881800000825.GIF" wi="118" he="87" />令<img file="FDA00006623881800000826.GIF" wi="187" he="82" />然后执行步骤11;步骤11:判断变量L的值是否小于3,如果L<3,则执行步骤12至步骤16;如果L≥3,则得到MBHMM分类器φ<sub>c</sub>,结束操作;步骤12:使用步骤2中所述输入到第L层整体分类器<img file="FDA00006623881800000815.GIF" wi="82" he="79" />的特征数据流X<sup>v</sup>验证步骤10得到的整体分类器<img file="FDA00006623881800000816.GIF" wi="98" he="78" />具体验证方法为:用<img file="FDA00006623881800000817.GIF" wi="189" he="105" />表示观察向量序列<img file="FDA00006623881800000818.GIF" wi="68" he="70" />是否被整体分类器<img file="FDA00006623881800000819.GIF" wi="79" he="79" />正确分类,如果观察向量序列<img file="FDA00006623881800000820.GIF" wi="69" he="78" />被正确分类,设定<maths num="0017" id="cmaths0017"><math><![CDATA[<mrow><msubsup><mi>H</mi><mi>L</mi><mi>c</mi></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>=</mo><mn>1</mn><mo>;</mo></mrow>]]></math><img file="FDA00006623881800000821.GIF" wi="279" he="113" /></maths>否则,设定<maths num="0018" id="cmaths0018"><math><![CDATA[<mrow><msubsup><mi>H</mi><mi>L</mi><mi>c</mi></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mn>1</mn><mo>;</mo></mrow>]]></math><img file="FDA00006623881800000822.GIF" wi="309" he="104" /></maths>步骤13:通过公式(17)计算整体分类器<img file="FDA00006623881800000823.GIF" wi="82" he="77" />的训练误差,用<img file="FDA00006623881800000831.GIF" wi="73" he="71" />表示;<maths num="0019" id="cmaths0019"><math><![CDATA[<mrow><msubsup><mi>E</mi><mi>L</mi><mi>c</mi></msubsup><mo>=</mo><munder><mi>&Sigma;</mi><mrow><msubsup><mi>H</mi><mi>L</mi><mi>c</mi></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mn>1</mn></mrow></munder><msub><mi>W</mi><mi>L</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>17</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA00006623881800000824.GIF" wi="1899" he="149" /></maths>步骤14:使用变量L′,并设定L′=L+1;步骤15:通过公式(18)依次计算输入到整体分类器<img file="FDA0000662388180000095.GIF" wi="103" he="86" />的特征数据流中的第r个观察向量序列<img file="FDA0000662388180000094.GIF" wi="65" he="76" />的权重,用W<sub>L′</sub>(r)表示;<maths num="0020" id="cmaths0020"><math><![CDATA[<mrow><msub><mi>W</mi><msup><mi>L</mi><mo>&prime;</mo></msup></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>W</mi><mi>L</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow></mrow><msubsup><mi>Z</mi><msup><mi>L</mi><mo>&prime;</mo></msup><mo>&prime;</mo></msubsup></mfrac><mo>&times;</mo><msup><mi>e</mi><mrow><mo>-</mo><msubsup><mi>H</mi><mi>L</mi><mi>c</mi></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>&delta;</mi><mi>L</mi><mo>&prime;</mo></msubsup></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>18</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000091.GIF" wi="1898" he="157" /></maths>其中,Z′<sub>L′</sub>是归一化因子,<maths num="0021" id="cmaths0021"><math><![CDATA[<mrow><msubsup><mi>Z</mi><msup><mi>L</mi><mo>&prime;</mo></msup><mo>&prime;</mo></msubsup><mo>=</mo><munder><mi>&Sigma;</mi><mi>r</mi></munder><mrow><mo>(</mo><msub><mi>W</mi><mi>L</mi></msub><mrow><mo>(</mo><mi>r</mi><mo>)</mo></mrow><mo>&times;</mo><msup><mi>e</mi><mrow><mo>-</mo><msubsup><mi>H</mi><mi>L</mi><mi>c</mi></msubsup><mrow><mo>(</mo><msubsup><mi>x</mi><mi>r</mi><mi>v</mi></msubsup><mo>)</mo></mrow><mo>&times;</mo><msubsup><mi>&delta;</mi><mi>L</mi><mo>&prime;</mo></msubsup></mrow></msup><mo>)</mo></mrow><mo>,</mo></mrow>]]></math><img file="FDA0000662388180000092.GIF" wi="649" he="155" /></maths><maths num="0022" id="cmaths0022"><math><![CDATA[<mrow><msubsup><mi>&delta;</mi><mi>L</mi><mo>&prime;</mo></msubsup><mo>=</mo><mfrac><mrow><mi>ln</mi><mo>[</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msubsup><mi>E</mi><mi>L</mi><mi>c</mi></msubsup><mo>)</mo></mrow><mo>/</mo><msubsup><mi>E</mi><mi>L</mi><mi>c</mi></msubsup><mo>]</mo></mrow><mn>2</mn></mfrac><mo>;</mo></mrow>]]></math><img file="FDA0000662388180000093.GIF" wi="506" he="176" /></maths>步骤16:令L=L′,W<sub>L</sub>(r)=W<sub>L′</sub>(r),然后返回到步骤2;所述识别过程的具体实施步骤如下:步骤四、对待识别情感视频x进行预处理,得到待识别情感视频的表情观察向量序列x<sup>f</sup>、肩部观察向量序列x<sup>s</sup>和音频观察向量序列x<sup>a</sup>;所述得到待识别情感视频x的表情观察向量序列和肩部观察向量序列的具体步骤与训练过程的步骤一中所述得到表情观察向量序列和肩部观察向量序列的具体步骤一致;所述得到待识别情感视频的音频观察向量序列的具体步骤与训练过程的步骤一中所述得到音频观察向量序列的具体步骤为一致;步骤五、判断待识别情感视频的情感类别,具体过程为:第a步:将待识别情感视频的音频观察向量序列x<sup>a</sup>作为每一种情感的MBHMM分类器φ<sub>c</sub>的第1层整体分类器中的每一个连续型HMM分量分类器的观察序列;将待识别情感视频的表情观察向量序列x<sup>f</sup>作为每一种情感的MBHMM分类器φ<sub>c</sub>的第2层整体分类器中的每一个连续型HMM分量分类器的观察序列;将待识别情感视频的肩部观察向量序列x<sup>s</sup>作为每一种情感的MBHMM分类器φ<sub>c</sub>的第3层整体分类器中的每一个连续型HMM分量分类器的观察序列;第b步:分别计算待识别情感视频x的观察向量序列x<sup>a</sup>、x<sup>f</sup>和x<sup>s</sup>在MBHMM分类器φ<sub>c</sub>中对应连续型HMM分量分类器<img file="FDA0000662388180000096.GIF" wi="101" he="84" />下的概率<img file="FDA0000662388180000097.GIF" wi="263" he="112" />第c步:通过公式(19)计算待识别情感视频x的观察向量序列x<sup>a</sup>、x<sup>f</sup>和x<sup>s</sup>,在MBHMM分类器φ<sub>c</sub>中对应整体分类器<img file="FDA0000662388180000098.GIF" wi="79" he="77" />下的概率<img file="FDA0000662388180000099.GIF" wi="252" he="94" /><maths num="0023" id="cmaths0023"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><msup><mi>x</mi><mi>v</mi></msup><mo>|</mo><msubsup><mi>&psi;</mi><mi>c</mi><mi>L</mi></msubsup><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><msubsup><mi>K</mi><mi>c</mi><mi>L</mi></msubsup></munderover><msub><mi>&delta;</mi><mi>k</mi></msub><mi>P</mi><mrow><mo>(</mo><msup><mi>x</mi><mi>v</mi></msup><mo>|</mo><msubsup><mi>&theta;</mi><mi>k</mi><mrow><mi>c</mi><mo>,</mo><mi>L</mi></mrow></msubsup><mo>)</mo></mrow></mrow><msubsup><mi>K</mi><mi>c</mi><mi>L</mi></msubsup></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>19</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000101.GIF" wi="1922" he="245" /></maths>第d步:通过公式(20)计算待识别情感视频x,在MBHMM分类器φ<sub>c</sub>下的概率P<sub>c</sub>;<maths num="0024" id="cmaths0024"><math><![CDATA[<mrow><msub><mi>P</mi><mi>c</mi></msub><mo>=</mo><mi>P</mi><mrow><mo>(</mo><mi>x</mi><mo>|</mo><msub><mi>&phi;</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mi>L</mi></munder><msubsup><mi>&delta;</mi><mi>L</mi><mo>&prime;</mo></msubsup><mi>P</mi><mrow><mo>(</mo><msup><mi>x</mi><mi>v</mi></msup><mo>|</mo><msubsup><mi>&psi;</mi><mi>c</mi><mi>L</mi></msubsup><mo>)</mo></mrow><mo>)</mo></mrow><mo>/</mo><mn>3</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>20</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000662388180000102.GIF" wi="1904" he="182" /></maths>第e步:从第d步得到的概率P<sub>c</sub>中找到最大值,得到该最大值的MBHMM分类器对应的情感即为待识别情感视频所属的情感类别。
地址 100081 北京市海淀区中关村南大街5号软件学院