发明名称 基于神经网络的人脸识别方法
摘要 一种基于神经网络的人脸识别方法属于人工智能和模式识别技术领域,其特征是:(1)在训练阶段,首先通过已知类别的人脸图像对神经网络进行训练,将人脸特征的提取用神经网络的学过程实现,将人脸特征的描述用连接权大小表示,然后用训练样本测试训练好的神经网络并确定分类阈值;(2)在识别阶段,将待识别人脸图像输入到神经网络,计算神经网络输出向量,取其中最大分量与分类阈值比较给出识别结果。本发明的优点是对环境光照、视角、表情、化妆等多种因素引起的人脸图像变化有强的鲁棒性,解决了人脸图像中“神似”特征的提取和表示,识别时对每幅人脸图像处理的时间相同。
申请公布号 CN103020602B 申请公布日期 2015.10.14
申请号 CN201210545155.4 申请日期 2012.12.14
申请人 北京建筑工程学院 发明人 田启川;张兰芳;陈志新;王亚慧;李临生
分类号 G06K9/00(2006.01)I;G06N3/08(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 太原市科瑞达专利代理有限公司 14101 代理人 王思俊
主权项 一种基于神经网络的人脸识别方法,其特征在于实施步骤为:(1)采集人脸图像,通过人脸检测和定位算法在人脸图像中分割人脸,将这些人脸图像统一缩放成M×M像素的灰度图像,设需要识别的人数为W,取每个人的人脸图像幅数为C,W和C均为正整数,人脸图像P<sup>(i,j)</sup>表示第i人的第j幅图像,i=1,2,…,W,j=1,2,…,C,P<sup>(i)</sup>表示第i人的全部图像,有P<sup>(i,j)</sup>∈P<sup>(i)</sup>,构造期望输出向量D<sup>(i)</sup>=(d<sub>1</sub><sup>(i)</sup>,d<sub>2</sub><sup>(i)</sup>,…,d<sub>i</sub><sup>(i)</sup>,…,d<sub>W</sub><sup>(i)</sup>),其中d<sub>i</sub><sup>(i)</sup>取0.8~1.0,D<sup>(i)</sup>其余的分量为0.0~0.2;(2)设计神经网络的结构,采用输入层、三个隐层和输出层的五层神经网络,输入层节点数为M×M,隐层节点数为(4~8)log<sub>2</sub>(M<sup>2</sup>+W<sup>2</sup>),输入层和隐层的输出函数均选为tansig函数,输出层节点数为需要识别的人数W,输出函数选purelin函数,将均方误差作为训练停止的条件;(3)训练神经网络,取已知人脸样本P<sup>(i,j)</sup>作为神经网络输入,计算神经网络输出向量O<sup>(i,j)</sup>=(o<sub>1</sub><sup>(i,j)</sup>,o<sub>2</sub><sup>(i,j)</sup>,…,o<sub>i</sub><sup>(i,j)</sup>,…,o<sub>W</sub><sup>(i,j)</sup>),并与已知人脸样本对应的期望输出向量D<sup>(i)</sup>=(d<sub>1</sub><sup>(i)</sup>,d<sub>2</sub><sup>(i)</sup>,…,d<sub>i</sub><sup>(i)</sup>,…,d<sub>W</sub><sup>(i)</sup>)比较,将比较误差E<sup>(i,j)</sup>=D<sup>(i)</sup>‑O<sup>(i,j)</sup>用于调节神经网络连接权大小,反复训练神经网络,直到均方误差<img file="FDA00002590685100011.GIF" wi="365" he="123" />满足要求;(4)将P<sup>(i,j)</sup>(i=1,2,…,W,j=1,2,…,C)逐一输入神经网络,记录所有的输出O<sup>(i,j)</sup>(i=1,2,…,W,j=1,2,…,C),将O<sup>(i,j)</sup>中所有第i个分量看作同一类样本same,将O<sup>(i,j)</sup>中除第i个分量外的其它分量看作另外一类样本different,根据对same和different两类样本的统计分析,确定分类阈值T,此时,训练好的神经网络就可作为人脸识别器;(5)识别时,将待识别人脸图像P输入到神经网络,计算输出向量O=(o<sub>1</sub>,o<sub>2</sub>,…,o<sub>W</sub>),若O=(o<sub>1</sub>,o<sub>2</sub>,…,o<sub>W</sub>)中第K个分量最大,即<img file="FDA00002590685100012.GIF" wi="334" he="119" />且o<sub>K</sub>&gt;T,那么待识别人脸图像P属于第K个人,否则给出“不认识”的结果。
地址 100044 北京市西城区展览馆路1号