发明名称 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法
摘要 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,包括离线训练阶段,首先对选取的各类行为序列训练数据进行图像预处理,获得所有训练数据的总样本数据矩阵A;将A进行非负矩阵分解(NMF),获得基矩阵W和基向量数r,根据W和A得到各类训练行为序列的特征矩阵Ei;初始化各类训练行为序列的隐马尔科夫模型(HMM),并分别估计其最优参数;在线识别阶段,首先对输入的待识别行为序列进行图像预处理,获得该行为序列的原始矩阵a;根据W和a得到特征矩阵e;最后计算待识别行为序列与各类训练行为序列的似然值,确定其行为类别。本发明得到的人体行为识别率较高,可提高应用于实时智能视频监控系统中的人体行为自动分析能力。
申请公布号 CN102393910A 申请公布日期 2012.03.28
申请号 CN201110181112.8 申请日期 2011.06.29
申请人 浙江工业大学 发明人 宦若虹;王浙沪;唐晓梅;陈庆章
分类号 G06K9/62(2006.01)I 主分类号 G06K9/62(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;王利强
主权项 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法,其特征在于:所述人体行为识别方法包括以下过程:(一)、离线训练阶段,包括以下步骤:1.1,在行为数据库中选取待识别类型行为序列作为训练数据,假设共选取了NUM个行为序列,NUM为自然数,对每一行为序列进行图像预处理,得到该行为连续N帧的二值化图像;1.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则一个训练行为序列可以得到一个包含N列的原始矩阵Ai;1.3,将NUM个训练行为序列所得到的原始矩阵按列方式组合在一起,得到一个具有N×NUM列的总样本数据矩阵A;1.4,将获得的总样本数据矩阵A进行非负矩阵分解,以获得基矩阵W和系数矩阵H,分解原理为:Am×n≈Wm×rHr×n其中,r为基向量数,其为任意值且(m+n)r<m×n;分解方法为对W和H按下式进行迭代更新,直至||A‑WH||2收敛: <mrow> <msub> <mi>H</mi> <mi>ij</mi> </msub> <mo>&LeftArrow;</mo> <msub> <mi>H</mi> <mi>ij</mi> </msub> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <mi>A</mi> <mo>)</mo> </mrow> <mi>ij</mi> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <mi>WH</mi> <mo>)</mo> </mrow> <mi>ij</mi> </msub> </mfrac> </mrow> <mrow> <msub> <mi>W</mi> <mi>ki</mi> </msub> <mo>&LeftArrow;</mo> <msub> <mi>W</mi> <mi>ki</mi> </msub> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>AH</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mi>ki</mi> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>WHH</mi> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mi>ki</mi> </msub> </mfrac> </mrow>其中,ij和ki均为矩阵的下标,表示矩阵在第i(k)行和第j(i)列的值;1.5,以基矩阵W的列向量为基向量构造特征子空间,将每一个训练行为序列的原始矩阵Ai投影到该特征子空间,得到该训练行为序列的特征向量ei,计算公式为:ei=WTAi则可知ei的大小为r×N,按列组合ei可得各类训练行为特征矩阵Ei;1.6,为每一类行为建立一个隐马尔科夫模型,初始化各类行为的隐马尔科夫模型,并采用Baum‑Welch算法根据各类训练行为特征矩阵Ei分别估计各个隐马尔科夫模型的最优参数;(二)在线识别阶段,包括以下步骤:2.1,读取待识别的测试行为序列,对其进行图像预处理,得到该行为连续N帧的二值化图像;2.2,将得到的每一帧二值化图像的像素矩阵按列拆开,并按顺序首尾相连形成一列,则得到一个N列的原始矩阵a;2.3,以训练样本所得到的基矩阵W的列向量为基向量构造特征子空间,将待识别行为序列的原始矩阵a投影到该特征子空间,得到该行为序列的特征向量er×N,计算公式为:e=WTa2.4,使用在离线训练阶段已经估计好最优参数的HMM,使用前向后向算法分别计算特征向量e与每一类训练行为在N个分量上的似然值;2.5,计算待识别行为序列与每一类训练行为序列的总似然值,即将N个分量上的似然值相加,并比较总似然值大小,依最大似然原则,总似然值最大的训练行为所在的行为类别即为该行为的行为类别,完成人体行为识别。
地址 310014 浙江省杭州市下城区朝晖六区