发明名称 基于分层观测向量分解的隐马尔科夫模型的行为识别方法
摘要 本发明涉及一种基于分层观测向量分解的隐马尔科夫模型的行为识别方法,包括目标检测、目标跟踪、特征提取、运动建模、行为识别等几个方面。其中该方法针对目前多人行为识别方法的不足对传统的隐马尔科夫模型进行改进,分离了模型中的个体状态和交互状态来突出目标之间的交互关系,通过分解观测节点来降低计算量,同时,该模型允许参加运动的目标个数发生变化,在特征选取问题上比传统方法也有了很大的灵活性,允许同时使用离散特征和连续特征。本发明对于视频监控、基于内容的视频检索等领域中的多人交互的行为分析有重要作用。
申请公布号 CN101739568A 申请公布日期 2010.06.16
申请号 CN200910236898.1 申请日期 2009.11.04
申请人 北京交通大学 发明人 苗振江;郭萍;邓海峰
分类号 G06K9/62(2006.01)I;G06T7/20(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 北京正理专利代理有限公司 11257 代理人 张占榜
主权项 1.基于分层观测向量分解的隐马尔科夫模型的行为识别方法,其特征在于包括以下步骤:步骤S1)运动目标检测:对摄像头拍摄的运动区域建立背景模型,当运动目标进入拍摄区域后进行前景提取,得到运动目标的轮廓;步骤S2)运动目标跟踪:根据检测的结果初始化目标的位置,之后对目标进行跟踪,得到运动目标的运动轨迹;步骤S3)行为特征提取:提取运动目标的轨迹特征和轮廓特征,轨迹特征主要包括两两运动目标之间的距离、两两目标的运动速度之差及两两目标之间的运动方向夹角,轮廓特征主要包括轮廓变化率和目标的最小外接矩形框的长宽比;步骤S4)运动模型训练:对于要识别的每一种行为,将其所有的用于训练的视频的特征输入到基于分层的观测向量分解的隐马尔科夫模型中,训练该行为的模型参数并保存,该模型分离出个体状态和交互状态,将观测向量按照特征的种类进行分解,训练方法如下:所述基于分层的观测向量分解的隐马尔科夫模型中有两条马尔科夫链,参数估计过程对两条链分别进行,参数集合为λ=(A,B,π),其中,π(m)=P(S<sub>0</sub>=m)表示每条链中每个状态S的初始概率分布,m为状态可取的一种值,设状态的取值空间为M,则m∈M;A(m,n)=P(S<sub>t+1</sub>=n|S<sub>t</sub>=m)表示每条链内的状态转移概率;<img file="F2009102368981C0000011.GIF" wi="733" he="62" />表示两条链之间的状态转移概率,其中i,j=1,2,且i与j不相等;B<sub>i</sub>(O<sub>t</sub>)=P(O<sub>t</sub>|S<sub>t</sub>=m)表示第i条链的符号产生概率,其中i=1,2;在此模型中,每组观测节点对输出概率的贡献程度不同,每个状态的符号产生概率由每组观测节点的概率加权求和得到,即:<maths num="0001"><![CDATA[<math><mrow><msub><mi>B</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>O</mi><mi>t</mi></msub><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>&omega;</mi><mi>k</mi></msub><mi>P</mi><mrow><mo>(</mo><msubsup><mi>O</mi><mi>t</mi><mi>k</mi></msubsup><mo>|</mo><msub><mi>S</mi><mi>t</mi></msub><mo>=</mo><mi>m</mi><mo>)</mo></mrow></mrow></math>]]></maths>,其中,<img file="F2009102368981C0000013.GIF" wi="800" he="99" /><img file="F2009102368981C0000014.GIF" wi="337" he="122" />其中N表示特征的种类数,RR表示人数,ω<sub>k</sub>表示第k种特征对输出概率的贡献权重;对于选用的离散特征来讲,<img file="F2009102368981C0000021.GIF" wi="800" he="254" />其中c为特征可以的取值,设特征的取值空间为C,则c∈C;对于连续特征来说,假设特征向量服从混合高斯分布,则有:<img file="F2009102368981C0000022.GIF" wi="513" he="120" />,其中,N(u,δ)表示均值为μ,方差为δ的高斯分布,c<sub>k</sub>为每个高斯分布的权重;步骤S5)行为识别:将未知行为视频的特征输入到每一个已经训练好的运动模型中,计算未知行为与每种已知运动模型的匹配概率,得到识别结果;其中,后验概率的计算方法采用递归的前向算法,具体递归过程如下:令<img file="F2009102368981C0000023.GIF" wi="792" he="63" />①初始化:<img file="F2009102368981C0000024.GIF" wi="800" he="69" />②递归:<img file="F2009102368981C0000025.GIF" wi="666" he="61" /><img file="F2009102368981C0000026.GIF" wi="800" he="73" />③终止:<maths num="0002"><![CDATA[<math><mrow><mi>p</mi><mrow><mo>(</mo><mi>O</mi><mo>|</mo><mi>&lambda;</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mi>i</mi></munder><munder><mi>&Sigma;</mi><mi>j</mi></munder><msub><mi>&alpha;</mi><mrow><mi>T</mi><mo>-</mo><mn>1</mn></mrow></msub><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>.</mo></mrow></math>]]></maths>
地址 100044 北京市海淀区上园村3号