发明名称 一种基于隐马尔可夫模型的人脸识别方法
摘要 本发明涉及一种基于隐马尔可夫模型的人脸识别方法,具体包括以下步骤:建立人脸隐马尔可夫模型;对样本图像采样,得到特征向量,确定模型各初始参数;反复迭代训练隐马尔可夫模型,对于每个人脸都产生一个具有不同参数隐马尔可夫模型;对待识别图像采样,得到特征向量;将待识别图像的特征向量分割,对所有隐马尔可夫模型递进地计算最大相似度,同时排除相似度最小的隐马尔可夫模型,最后得到识别结果。本发明利用人脸HMM的结构确定的隐含状态总是从代表头部的状态开始,并且只可能向下一个状态转移的特征和Viterbi算法动态规划的特性,将观察向量分割,并在计算相似度时通过中间结果来排除可能性较小的人脸模型,达到减少计算量的效果。
申请公布号 CN103034847B 申请公布日期 2016.02.10
申请号 CN201210538786.3 申请日期 2012.12.13
申请人 河海大学 发明人 刘惠义;王志超;周斌;秦川
分类号 G06K9/00(2006.01)I;G06K9/62(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 柏尚春
主权项 一种基于隐马尔可夫模型的人脸识别方法,其特征在于,包括以下步骤:1)建立人脸隐马尔可夫模型;2)对样本图像采样,得到特征向量,确定模型各初始参数;3)反复迭代训练隐马尔可夫模型,根据给定样本个数,对于每个人脸都产生一个具有不同参数隐马尔可夫模型,一共m个,m≥1;4)对待识别图像采样,得到特征向量;5)将待识别图像的特征向量分割,对所有隐马尔可夫模型递进地计算最大相似度,同时排除相似度最小的隐马尔可夫模型,最后得到识别结果;其中建立人脸图像的隐马尔可夫模型是以头发、额头、眼睛、鼻子和嘴巴区域作为隐含状态来建立相关的模型;所述步骤2具体包括如下步骤:1)对样本图像进行预处理,进行灰度化,归一化处理,去除图像的色彩信息并归一为统一的图像尺寸;2)对样本图像使用采样窗口进行采样;3)对采样窗口进行和特征提取,提取后的特征作为样本图像的观察序列;4)平均分割图像,并初始化模型参数;步骤4具体包括如下步骤:1)对待识别图像进行预处理,进行灰度化,归一化处理,去除图像的色彩信息并归一为与样本图像相同的尺寸;2)对待识别图像窗口进行采样和特征提取,采样窗口的宽度、高度均与样本图像相同;3)对采样窗口进行和特征提取,提取后的特征作为待识别图片的观察序列;步骤5包括如下步骤:1)根据步骤4得到待识别图片长度为T的观察序列O=O<sub>1</sub>O<sub>2</sub>...O<sub>T</sub>,其中T&gt;5,表示图像采样窗口的个数.将O平均分割为n份,每份长度为<img file="FDA0000854499790000011.GIF" wi="211" he="128" />将O=O<sub>1</sub>O<sub>2</sub>...O<sub>T/n</sub>代入所有m个HMM中使用Viterbi算法计算相似度,m表示已经训练好的隐马尔可夫模型的个数,m≥1,得到m个δ<sub>T/n</sub>(i),δ<sub>T/n</sub>(i)表示当前观察序列在隐马尔可夫模型中的相似度,同时淘汰最小的<img file="FDA0000854499790000021.GIF" wi="65" he="118" />个δ<sub>T/n</sub>(i)对应的HMM;3)将O<sub>T/n</sub>O<sub>T+1/n</sub>...O<sub>2T/n</sub>代入<img file="FDA0000854499790000022.GIF" wi="139" he="116" />个HMM中,同样得到<img file="FDA0000854499790000023.GIF" wi="414" he="116" />淘汰掉最小的<img file="FDA0000854499790000024.GIF" wi="56" he="122" />个δ<sub>2T/n</sub>(i)对应的HMM;上述步骤进行n次,每次都带入<img file="FDA0000854499790000025.GIF" wi="57" he="132" />个观察序列,保存中间结果δ(i),然后根据δ(i)排除最小的<img file="FDA0000854499790000026.GIF" wi="59" he="117" />个HMM,最后在剩余的<img file="FDA0000854499790000027.GIF" wi="63" he="116" />中计算P<sub>l</sub>=max[δ<sub>T</sub>(i)],求出的<img file="FDA0000854499790000028.GIF" wi="222" he="92" />即为识别的结果;若存在同属一个人的待识别图像,计算每个图像的识别结果,取次数最多的作为结果输出。
地址 210098 江苏省南京市西康路1号