发明名称 基于光流方向直方图和肤色流形变分的敏感视频识别方法
摘要 本发明涉及一种基于光流方向直方图和肤色流形变分的敏感视频识别方法,是通过以下步骤实现的:下载原始视频、并对视频解压;计算每一帧的运动特征:计算光流方向直方图并通过光流直方图分类器进行分类;同时计算图像特征:根据肤色流形分类器进行肤色分割,判别其肤色比例是否超过阈值;当运动特征和图像特征都敏感的时候,判定这一帧敏感;本发明的有益效果是:用于检测互联网上的黄色视频信息,使用户免受黄色信息的毒害。
申请公布号 CN101051344B 申请公布日期 2010.05.12
申请号 CN200610025448.4 申请日期 2006.04.04
申请人 王谦 发明人 王谦
分类号 G06K9/00(2006.01)I;G06T7/00(2006.01)I;H04L12/24(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 上海智信专利代理有限公司 31002 代理人 胡美强
主权项 1.一种基于光流方向直方图和肤色流形变分的敏感视频识别方法,是通过以下步骤实现的:下载原始视频、并对视频解压;计算每一帧的运动特征:计算光流方向直方图并通过光流直方图分类器进行分类;同时计算图像特征:根据肤色流形分类器进行肤色分割,判别其肤色比例是否超过阈值;当运动特征和图像特征都敏感的时候,判定这一帧敏感;所述的光流方向直方图并与光流直方图分类器比较是通过以下步骤实现的:光流的约束方程:考虑图象的象素m=(x,y)<sup>T</sup>,时刻t的灰度值I(x,y,t),令点m的速度为V<sub>m</sub>=(v<sub>x</sub>+v<sub>y</sub>)<sup>T</sup>,若点m的速度保持不变,那么在很短的时间间隔dt内,有:I(x+V<sub>x</sub>dt,y+v<sub>y</sub>dt,t+dt)=I(x,y,t)<maths num="0001"><![CDATA[<math><mrow><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>x</mi></mrow></mfrac><msub><mi>v</mi><mi>x</mi></msub><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>y</mi></mrow></mfrac><msub><mi>v</mi><mi>y</mi></msub><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>t</mi></mrow></mfrac><mo>+</mo><mi>O</mi><mrow><mo>(</mo><msup><mi>dt</mi><mn>2</mn></msup><mo>)</mo></mrow><mo>=</mo><mi>I</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>t</mi><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0002"><![CDATA[<math><mrow><mo>&dtri;</mo><mi>I</mi><mo>&CenterDot;</mo><msub><mi>v</mi><mi>m</mi></msub><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>t</mi></mrow></mfrac><mo>=</mo><mn>0</mn></mrow></math>]]></maths>其中<maths num="0003"><![CDATA[<math><mrow><mo>&dtri;</mo><mi>I</mi><mo>=</mo><msup><mrow><mo>[</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>x</mi></mrow></mfrac><mo>,</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>y</mi></mrow></mfrac><mo>]</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>设v<sub>x</sub>=u,v<sub>y</sub>=v<maths num="0004"><![CDATA[<math><mrow><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>t</mi></mrow></mfrac><mo>=</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>x</mi></mrow></mfrac><mi>u</mi><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>y</mi></mrow></mfrac><mi>v</mi></mrow></math>]]></maths>可以用正则化技术求光流使下式最小:<maths num="0005"><![CDATA[<math><mrow><mo>&Integral;</mo><mo>&Integral;</mo><msup><mrow><mo>(</mo><mo>&dtri;</mo><mi>I</mi><mo>&CenterDot;</mo><mi>v</mi><mo>+</mo><mfrac><mrow><mo>&PartialD;</mo><mi>I</mi></mrow><mrow><mo>&PartialD;</mo><mi>t</mi></mrow></mfrac><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><msup><mrow><mo>|</mo><mo>|</mo><msub><mrow><mo>&dtri;</mo><mi>v</mi></mrow><mi>x</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>|</mo><mo>|</mo><msub><mrow><mo>&dtri;</mo><mi>v</mi></mrow><mi>y</mi></msub><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow><mi>dxdy</mi></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><msub><mrow><mo>&dtri;</mo><mi>v</mi></mrow><mi>x</mi></msub><mo>=</mo><msup><mrow><mo>(</mo><mfrac><msub><mrow><mo>&PartialD;</mo><mi>v</mi></mrow><mi>x</mi></msub><mrow><mo>&PartialD;</mo><mi>x</mi></mrow></mfrac><mo>,</mo><mfrac><msub><mrow><mo>&PartialD;</mo><mi>v</mi></mrow><mi>x</mi></msub><mrow><mo>&PartialD;</mo><mi>y</mi></mrow></mfrac><mo>)</mo></mrow><mi>T</mi></msup><mo>;</mo><msub><mrow><mo>&dtri;</mo><mi>v</mi></mrow><mi>y</mi></msub><mo>=</mo><msup><mrow><mo>(</mo><mfrac><msub><mrow><mo>&PartialD;</mo><mi>v</mi></mrow><mi>y</mi></msub><mrow><mo>&PartialD;</mo><mi>x</mi></mrow></mfrac><mo>,</mo><mfrac><mrow><mo>&PartialD;</mo><msub><mi>v</mi><mi>y</mi></msub></mrow><mrow><mo>&PartialD;</mo><mi>y</mi></mrow></mfrac><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>在求得每一点的光流后,对整个图像求取光流方向直方图;在训练过程中将敏感视频中每帧的光流方向直方图和正常视频中每帧的光流直方图作为两类样本,输入到SVM分类器中训练;在识别阶段,用被测试视频中每帧的光流方向直方图在分类器中投影,计算其是否具有属于敏感运动特征;所述的根据肤色流形分类器进行肤色分割,判别其肤色比例是否超过阈值是通过以下步骤实现的:肤色流形参数变分估计:参数描述:假设观测为y=(y<sub>1</sub>,…y<sub>N</sub>),其中y<sub>1</sub>,…y<sub>N</sub>均为p维向量,N为观测样本的总数;假设隐藏变量为x=(x<sub>1</sub>,…x<sub>N</sub>),其中x<sub>1</sub>,…x<sub>N</sub>均为k维向量,分别表示对应观测的状态,在所处理的混合高斯模型中,k=1;假设对每一类样本c<sub>j</sub>,其均值和逆协方差阵分别为<img file="F2006100254484C00021.GIF" wi="259" he="66" />即p(y<sub>j</sub>|x<sub>j</sub>)=N(y<sub>j</sub>;μ<sub>j</sub>,Γ<sub>j</sub>);设p(x<sub>j</sub>)=π<sub>j</sub>,这样模型参数为(π<sub>j</sub>,μ<sub>j</sub>,Γ<sub>j</sub>);同时对模型参数设定先验概率分布,为了使得模型的先验分布和后验分布性质一致,设定π<sub>j</sub>服从Dirichelet分布,μ<sub>j</sub>服从高斯分布,Γ<sub>j</sub>服从Wishart分布,即:<maths num="0007"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mo>{</mo><msub><mi>&pi;</mi><mi>j</mi></msub><mo>}</mo><mo>;</mo><mo>{</mo><msub><mi>&lambda;</mi><mi>j</mi></msub><mo>}</mo><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><msub><mi>m&lambda;</mi><mn>0</mn></msub><mo>)</mo></mrow></mrow><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><msub><mi>&lambda;</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>.</mo><mo>.</mo><mo>.</mo><mi>&Gamma;</mi><mrow><mo>(</mo><msub><mi>&lambda;</mi><mn>0</mn></msub><mo>)</mo></mrow></mrow></mfrac><munderover><mi>&Pi;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msubsup><mi>&pi;</mi><mi>j</mi><mrow><msub><mi>&lambda;</mi><mi>j</mi></msub><mo>-</mo><mn>1</mn></mrow></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<maths num="0008"><![CDATA[<math><mrow><msub><mi>&pi;</mi><mn>1</mn></msub><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>&pi;</mi><mi>m</mi></msub><mo>&GreaterEqual;</mo><mn>0</mn><mo>;</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>&pi;</mi><mi>j</mi></msub><mo>=</mo><mn>1</mn></mrow></math>]]></maths><maths num="0009"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>|</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mi>N</mi><mrow><mo>(</mo><msub><mi>&mu;</mi><mi>j</mi></msub><mo>;</mo><msup><mi>&rho;</mi><mn>0</mn></msup><mo>,</mo><msup><mi>&beta;</mi><mn>0</mn></msup><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0010"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>Z</mi></mfrac><msup><mrow><mo>|</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>|</mo></mrow><mrow><mrow><mo>(</mo><msup><mi>v</mi><mn>0</mn></msup><mo>-</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>tr</mi><mo>[</mo><msup><mi>&Phi;</mi><mn>0</mn></msup><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>]</mo><mo>/</mo><mn>2</mn></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中<maths num="0011"><![CDATA[<math><mrow><mi>Z</mi><mo>=</mo><msup><mn>2</mn><mrow><mi>vk</mi><mo>/</mo><mn>2</mn></mrow></msup><msup><mi>&pi;</mi><mrow><mi>k</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>/</mo><mn>4</mn></mrow></msup><msubsup><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></msubsup><mi>&Gamma;</mi><mrow><mo>(</mo><mfrac><mrow><mi>v</mi><mo>+</mo><mn>1</mn><mo>-</mo><mi>i</mi></mrow><mn>2</mn></mfrac><mo>)</mo></mrow><mo>&times;</mo><msup><mrow><mo>|</mo><msup><mi>&Phi;</mi><mn>0</mn></msup><mo>|</mo></mrow><mrow><mo>-</mo><mi>v</mi><mo>/</mo><mn>2</mn></mrow></msup></mrow></math>]]></maths>Gamma函数<maths num="0012"><![CDATA[<math><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><msubsup><mo>&Integral;</mo><mn>0</mn><mrow><mo>+</mo><mo>&infin;</mo></mrow></msubsup><msup><mi>t</mi><mrow><mi>x</mi><mo>-</mo><mn>1</mn></mrow></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>t</mi></mrow></msup><mi>dt</mi></mrow></math>]]></maths>{λ<sub>j</sub>},ρ<sup>0</sup>,β<sup>0</sup>,v<sup>0</sup>,Φ<sup>0</sup>均为超参数,代表模型结构;根据Hinton的观点,优化p(y|θ)的过程可以转化为优化其下界<img file="F2006100254484C00031.GIF" wi="361" he="118" />的过程;设m表示结构,我们同样可以求取p(y|m)的相应下界:<maths num="0013"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>m</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mfrac><mrow><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow><mrow><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mfrac><mi>dxd&theta;</mi></mrow></math>]]></maths><maths num="0014"><![CDATA[<math><mrow><mo>=</mo><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mfrac><mrow><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow><mrow><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mfrac><mi>dxd&theta;</mi><mo>=</mo><mi>F</mi></mrow></math>]]></maths>假设x和θ独立,需要分别求出q(x)和q(θ)使得p(y|m)的下界F最大;q(x)和q(θ)可以分别看成是相应真实分布的变分估计,当这个估计与真实一致时,p(y|m)的下界F取最大;通过F分别对q(x)和q(θ)求导作变分求解:<maths num="0015"><![CDATA[<math><mrow><mfrac><mrow><mo>&PartialD;</mo><mi>F</mi></mrow><mrow><mo>&PartialD;</mo><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mn>0</mn><mo>&DoubleRightArrow;</mo><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>&Proportional;</mo><msup><mi>e</mi><mrow><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>d&theta;</mi></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0016"><![CDATA[<math><mrow><mfrac><mrow><mo>&PartialD;</mo><mi>F</mi></mrow><mrow><mo>&PartialD;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mn>0</mn><mo>&DoubleRightArrow;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>&Proportional;</mo><mi>p</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><msup><mi>e</mi><mrow><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>dx</mi></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中对q(x)估计的过程可以看成是E step,对q(θ)估计的过程可以看成是M step,由于q(θ)是对θ的后验估计,所以这个θ参数比经典EM中最大化p(y|θ)中的参数要可靠;变分混合高斯模型参数估计具体到混合高斯模型,我们分别按照(4)和(5)来求q(x)和q(θ),首先对ln p(x,y)作具体化:<maths num="0017"><![CDATA[<math><mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>|</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><msub><mi>y</mi><mi>i</mi></msub><mo>|</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow></math>]]></maths>然后求q(x):<maths num="0018"><![CDATA[<math><mrow><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>d&theta;</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>|</mo><msub><mi>x</mi><mi>i</mi></msub><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>d&theta;</mi></mrow></math>]]></maths><maths num="0019"><![CDATA[<math><mrow><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>&Proportional;</mo><msup><mi>e</mi><mrow><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mi>d&theta;</mi></mrow></msup><mo>&DoubleRightArrow;</mo><mi>q</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><mi>j</mi><mo>|</mo><msub><mi>y</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&Proportional;</mo><msup><mi>e</mi><mrow><mo>&Integral;</mo><mi>q</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mi>ln</mi><mi>p</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><mi>j</mi><mo>,</mo><msub><mi>y</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>d&theta;</mi></mrow></msup></mrow></math>]]></maths><maths num="0020"><![CDATA[<math><mrow><mo>&DoubleRightArrow;</mo><msubsup><mi>&gamma;</mi><mi>j</mi><mi>i</mi></msubsup><mo>=</mo><mi>q</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>i</mi></msub><mo>=</mo><mi>j</mi><mo>|</mo><msub><mi>y</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&Proportional;</mo><mo>&lt;</mo><mi>ln</mi><msub><mi>&pi;</mi><mi>j</mi></msub><mo>></mo><msup><mi>e</mi><mrow><mo>&lt;</mo><mi>ln</mi><mo>|</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>|</mo><mo>></mo><mo>/</mo><mn>2</mn></mrow></msup><msup><mi>e</mi><mrow><mo>-</mo><msup><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><msub><mi>&rho;</mi><mi>j</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>&lt;</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>></mo><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><msub><mi>&rho;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>d</mi><mo>/</mo><mn>2</mn><msub><mi>&beta;</mi><mi>j</mi></msub></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow></math>]]></maths>其中:<maths num="0021"><![CDATA[<math><mrow><mo>&lt;</mo><mi>ln</mi><msub><mi>&pi;</mi><mi>j</mi></msub><mo>></mo><mo>=</mo><mi>&psi;</mi><mrow><mo>(</mo><msubsup><mi>&lambda;</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>-</mo><mi>&psi;</mi><mrow><mo>(</mo><munder><mi>&Sigma;</mi><mi>k</mi></munder><msubsup><mi>&lambda;</mi><mi>k</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0022"><![CDATA[<math><mrow><mi>&psi;</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>d</mi><mi>ln</mi><mi>&Gamma;</mi><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow><mi>dx</mi></mfrac></mrow></math>]]></maths><maths num="0023"><![CDATA[<math><mrow><mo>&lt;</mo><mi>ln</mi><mo>|</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>|</mo><mo>></mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>d</mi></munderover><mi>&psi;</mi><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>v</mi><mi>j</mi></msub><mo>+</mo><mn>1</mn><mo>-</mo><mi>i</mi><mo>)</mo></mrow><mo>/</mo><mn>2</mn><mo>)</mo></mrow><mo>-</mo><mi>ln</mi><mo>|</mo><msub><mi>&Phi;</mi><mi>j</mi></msub><mo>|</mo><mo>+</mo><mi>d</mi><mi>ln</mi><mn>2</mn></mrow></math>]]></maths><maths num="0024"><![CDATA[<math><mrow><mo>&lt;</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>></mo><mo>=</mo><msub><mi>v</mi><mi>j</mi></msub><msubsup><mi>&Phi;</mi><mi>j</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></math>]]></maths>这是E step,接下来是通过M step估计参数的后验分布,预先定义几个变量:<maths num="0025"><![CDATA[<math><mrow><msub><mover><mi>&pi;</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>N</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>&gamma;</mi><mi>j</mi><mi>i</mi></msubsup></mrow></math>]]></maths>N<sub>j</sub>=Nπ<sub>j</sub><maths num="0026"><![CDATA[<math><mrow><msub><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mover><mi>N</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>&gamma;</mi><mi>j</mi><mi>i</mi></msubsup><msub><mi>y</mi><mi>i</mi></msub></mrow></math>]]></maths><maths num="0027"><![CDATA[<math><mrow><msub><mover><mi>&Sigma;</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mover><mi>N</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msubsup><mi>&gamma;</mi><mi>j</mi><mi>i</mi></msubsup><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><msub><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><msup><mrow><mo>(</mo><msub><mi>y</mi><mi>i</mi></msub><mo>-</mo><msub><mover><mi>&mu;</mi><mo>&OverBar;</mo></mover><mi>j</mi></msub><mo>)</mo></mrow><mi>T</mi></msup></mrow></math>]]></maths>将(1)(2)(3)(6)代入(5)得到关于(π<sub>j</sub>,μ<sub>j</sub>,Γ<sub>j</sub>)的新的Dirichelet分布,正态分布和Wishart分布,假设新参数形式如下:<maths num="0028"><![CDATA[<math><mrow><mi>q</mi><mrow><mo>(</mo><mo>{</mo><msub><mi>&pi;</mi><mi>j</mi></msub><mo>}</mo><mo>;</mo><mo>{</mo><msubsup><mi>&lambda;</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>}</mo><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><msubsup><mi>&lambda;</mi><mn>0</mn><mo>&prime;</mo></msubsup><mo>)</mo></mrow></mrow><mrow><mi>&Gamma;</mi><mrow><mo>(</mo><msubsup><mi>&lambda;</mi><mn>1</mn><mo>&prime;</mo></msubsup><mo>)</mo></mrow><mo>.</mo><mo>.</mo><mo>.</mo><mi>&Gamma;</mi><mrow><mo>(</mo><msubsup><mi>&lambda;</mi><mi>m</mi><mo>&prime;</mo></msubsup><mo>)</mo></mrow></mrow></mfrac><munderover><mi>&Pi;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msubsup><mi>&pi;</mi><mi>j</mi><mrow><msubsup><mi>&lambda;</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>-</mo><mn>1</mn></mrow></msubsup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow></mrow></math>]]></maths>p(μ<sub>j</sub>|Γ<sub>j</sub>)=N(μ<sub>j</sub>;ρ<sup>j</sup>,β<sup>j</sup>Γ<sub>j</sub>)    (9)<maths num="0029"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>Z</mi></mfrac><msup><mrow><mo>|</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>|</mo></mrow><mrow><mrow><mo>(</mo><msup><mi>v</mi><mi>j</mi></msup><mo>-</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></msup><msup><mi>e</mi><mrow><mo>-</mo><mi>tr</mi><mo>[</mo><msup><mi>&Phi;</mi><mi>j</mi></msup><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>]</mo><mo>/</mo><mn>2</mn></mrow></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow></mrow></math>]]></maths>可以求得新的参数分别为:λ′<sub>j</sub>=N<sub>j</sub>+λ<sup>0</sup>β<sub>j</sub>=N<sub>j</sub>+β<sup>0</sup>ρ<sub>j</sub>=(N<sub>j</sub>μ<sub>j</sub>+β<sup>0</sup>ρ<sup>0</sup>)/(N<sub>j</sub>+β<sup>0</sup>)v<sub>j</sub>=N<sub>j</sub>+v<sup>0</sup>Φ<sub>j</sub>=N<sub>j</sub>∑<sub>j</sub>+N<sub>j</sub>β<sup>0</sup>(μ<sub>j</sub>-ρ<sup>0</sup>)(μ<sub>j</sub>-ρ<sup>0</sup>)<sup>T</sup> /(N<sub>j</sub>+β<sup>0</sup>)+Φ<sup>0</sup>并且有:<maths num="0030"><![CDATA[<math><mrow><mo>&lt;</mo><msub><mi>&pi;</mi><mi>j</mi></msub><mo>></mo><mo>=</mo><msubsup><mi>&lambda;</mi><mi>j</mi><mo>&prime;</mo></msubsup><mo>/</mo><munder><mi>&Sigma;</mi><mi>k</mi></munder><msubsup><mi>&lambda;</mi><mi>k</mi><mo>&prime;</mo></msubsup></mrow></math>]]></maths>&lt;μ<sub>j</sub>&gt;=ρ<sub>j</sub><maths num="0031"><![CDATA[<math><mrow><mo>&lt;</mo><msub><mi>&Gamma;</mi><mi>j</mi></msub><mo>></mo><mo>=</mo><msub><mi>v</mi><mi>j</mi></msub><msubsup><mi>&Phi;</mi><mi>j</mi><mrow><mo>-</mo><mn>1</mn></mrow></msubsup></mrow></math>]]></maths>这就是对(π<sub>j</sub>,μ<sub>j</sub>,Γ<sub>j</sub>)的估计;肤色分类器设原来的样本为Y,新来一个样本y,则p(y|Y)服从混合的t分布:<maths num="0032"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><mo>&lt;</mo><msub><mi>&pi;</mi><mi>j</mi></msub><mo>></mo><msub><mi>t</mi><msub><mi>&omega;</mi><mi>j</mi></msub></msub><mrow><mo>(</mo><mi>y</mi><mo>|</mo><msub><mi>&rho;</mi><mi>j</mi></msub><mo>,</mo><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>&beta;</mi><mi>j</mi></msub><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>/</mo><msub><mi>&beta;</mi><mi>j</mi></msub><msub><mi>&omega;</mi><mi>j</mi></msub><mo>)</mo></mrow><msub><mi>&Phi;</mi><mi>j</mi></msub></mrow></mrow></math>]]></maths>ω<sub>j</sub>=v<sub>j</sub>+1-d当样本数目趋于无穷大时,p(y|Y)趋于混合高斯分布;设y的状态为x,则:<maths num="0033"><![CDATA[<math><mrow><mi>j</mi><mo>=</mo><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>j</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>,</mo><mi>x</mi><mo>=</mo><mi>j</mi><mo>|</mo><mi>Y</mi><mo>)</mo></mrow></mrow></math>]]></maths>其中<maths num="0034"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mi>y</mi><mo>,</mo><mi>x</mi><mo>=</mo><mi>j</mi><mo>|</mo><mi>Y</mi><mo>)</mo></mrow><mo>=</mo><mo>&lt;</mo><msub><mi>&pi;</mi><mi>j</mi></msub><mo>></mo><msub><mi>t</mi><msub><mi>&omega;</mi><mi>j</mi></msub></msub><mrow><mo>(</mo><mi>y</mi><mo>|</mo><msub><mi>&rho;</mi><mi>j</mi></msub><mo>,</mo><mrow><mo>(</mo><mrow><mo>(</mo><msub><mi>&beta;</mi><mi>j</mi></msub><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mo>/</mo><msub><mi>&beta;</mi><mi>j</mi></msub><msub><mi>&omega;</mi><mi>j</mi></msub><mo>)</mo></mrow><msub><mi>&Phi;</mi><mi>j</mi></msub></mrow><mo>.</mo></mrow></math>]]></maths>
地址 200127 上海市浦东新区崂山路689号306室