发明名称 基于在线学和贝叶斯推理的视频人脸识别与检索方法
摘要 本发明公开了一种基于在线学和贝叶斯推理的视频人脸识别与检索方法,包括以下步骤:步骤一:建立人脸识别模型的初始化模型。人脸识别初始模型采用GMM人脸识别模型。步骤二:建立人脸类别模型。使用增量学的方式对初始化的人脸模型进行模型更新。步骤三:进行视频人脸的识别与检索。给定测试序列和类别模型,利用贝叶斯推理过程累积视频中的序列识别信息,按照时间轴信息传播身份概率密度函数,并基于MAP规则得到识别分数,并给用户提供视频人脸识别结果。本发明建立了一个完全基于非监督学的模型训练框架,根据训练序列的空间分布,初始模型进化为形式不同的类别模型,通过调节人脸类别模型的高斯混和数以更好地拟合空间数据的分布。
申请公布号 CN101464950A 申请公布日期 2009.06.24
申请号 CN200910077122.X 申请日期 2009.01.16
申请人 北京航空航天大学 发明人 李江伟;苟高鹏;王蕴红
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 北京永创新实专利事务所 代理人 周长琪
主权项 1、一种基于在线学习和贝叶斯推理的视频人脸识别与检索方法,包括步骤一:建立人脸识别模型的初始化模型;所述的人脸识别初始模型采用GMM人脸识别模型;其特征在于,还包括如下步骤,步骤二:建立人脸类别模型;当新的训练序列到来时,对每帧图像进行人脸检测,并学习检测到的人脸来更新识别模型;在完成对当前序列的处理后,由于学习了更多的人脸样本,人脸识别模型逐步进化为反映类别信息的人脸类别模型,使用不同的训练视频序列对人脸初始模型<img file="A200910077122C00021.GIF" wi="122" he="46" />进行增量学习,最后通过增量学习的方式得到当前训练视频序列所对应的人脸类别模型;步骤三:进行视频人脸的识别与检索;给定测试视频序列和人脸类别模型,利用贝叶斯推理过程累积视频中的序列识别信息,按照时间轴信息传播身份概率密度函数,并基于MAP规则得到识别分数,并给用户提供视频人脸识别结果;根据步骤一、步骤二,分别学习J个训练视频,得到对应的人脸类别模型<maths num="0001"><![CDATA[<math><mrow><mrow><mo>{</mo><msub><mi>G</mi><mn>1</mn></msub><mrow><mo>(</mo><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mo>)</mo></mrow><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mi>G</mi><mi>i</mi></msub><mrow><mo>(</mo><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mo>)</mo></mrow><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><msub><mi>G</mi><mi>J</mi></msub><mrow><mo>(</mo><mover><mi>x</mi><mo>&RightArrow;</mo></mover><mo>)</mo></mrow><mo>}</mo></mrow><mo>;</mo></mrow></math>]]></maths>进行视频人脸的识别与检索具体步骤为:给定待检索的视频,利用人脸检测的方法检测人脸图像<img file="A200910077122C00023.GIF" wi="76" he="57" />结合步骤二所得到的人脸类别模型,利用贝叶斯推理求取关于身份变量的后验概率,并采用MAP规则获得当前人脸的身份信息:<maths num="0002"><![CDATA[<math><mrow><msup><mi>i</mi><mo>*</mo></msup><mo>=</mo><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>|</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>)</mo></mrow><mo>=</mo><mi>&eta;</mi><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><msub><mi>G</mi><mi>i</mi></msub><mrow><mo>(</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow></math>]]></maths>式中η为归一化的常数;监控视频中,假定在时空具有连续性的人脸样本集合中其身份变量保持不变,基于贝叶斯推理过程,得到身份变量的后验概率形式:<maths num="0003"><![CDATA[<math><mrow><msup><mi>i</mi><mo>*</mo></msup><mo>=</mo><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>|</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>,</mo><msubsup><mi>F</mi><mrow><mn>0</mn><mo>:</mo><mi>t</mi><mo>-</mo><mn>1</mn></mrow><mo>*</mo></msubsup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><mo>=</mo><mi>&eta;</mi><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><mi>p</mi><mrow><mo>(</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>|</mo><mi>i</mi><mo>,</mo><msubsup><mi>F</mi><mrow><mn>0</mn><mo>:</mo><mi>t</mi><mo>-</mo><mn>1</mn></mrow><mo>*</mo></msubsup><mo>)</mo></mrow><mo>&CenterDot;</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>|</mo><msubsup><mi>F</mi><mrow><mn>0</mn><mo>:</mo><mi>t</mi><mo>-</mo><mn>1</mn></mrow><mo>*</mo></msubsup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><mo>=</mo><mi>&eta;</mi><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><mi>p</mi><mrow><mo>(</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>|</mo><mi>i</mi><mo>,</mo><mo>)</mo></mrow><mo>&CenterDot;</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>|</mo><msubsup><mi>F</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow><mo>*</mo></msubsup><mo>,</mo><msubsup><mi>F</mi><mrow><mn>0</mn><mo>:</mo><mi>t</mi><mo>-</mo><mn>2</mn></mrow><mo>*</mo></msubsup><mo>)</mo></mrow></mrow></math>]]></maths><maths num="0006"><![CDATA[<math><mrow><mo>=</mo><mi>&eta;</mi><munder><mrow><mi>arg</mi><mi>max</mi></mrow><mi>i</mi></munder><msub><mi>G</mi><mi>i</mi></msub><mrow><mo>(</mo><msubsup><mi>F</mi><mi>t</mi><mo>*</mo></msubsup><mo>)</mo></mrow><mo>&CenterDot;</mo><mi>p</mi><mrow><mo>(</mo><mi>i</mi><mo>|</mo><msubsup><mi>F</mi><mrow><mi>t</mi><mo>-</mo><mn>1</mn></mrow><mo>*</mo></msubsup><mo>,</mo><msubsup><mi>F</mi><mrow><mn>0</mn><mo>:</mo><mi>t</mi><mo>-</mo><mn>2</mn></mrow><mo>*</mo></msubsup><mo>)</mo></mrow></mrow></math>]]></maths>获得当前人脸的身份信息i<sup>*</sup>,给用户提供视频人脸识别结果。
地址 100083北京市海淀区学院路37号