发明名称 优化的人脸识别预处理方法
摘要 本发明涉及一种优化的人脸识别预处理方法。该方法首先将从摄像机中得到的彩色人脸图像转化为灰度图像,接着对灰度图像进行尺度归一化处理使得人脸图像都有相同的尺寸和姿势,然后利用小波变换将人脸图像分解为低频分量和高频分量,并且仅对低频分量作直方图均衡化处理,将处理过的低频分量与各高频分量进行小波重构,最后对重构的图像用优化的中值滤波处理。本方法调整了人脸图像的灰度范围,增强了对比度,对于亮度较高的人脸灰度图像有较好的改善效果,提高了复杂光照环境下和不同姿态下的人脸识别效率。
申请公布号 CN101430759B 申请公布日期 2010.11.17
申请号 CN200810203954.7 申请日期 2008.12.04
申请人 上海大学;上海天冠卫视技术研居所 发明人 周贤君;郭凤;胡金演;王衎;吴旭;方针;王裕友
分类号 G06K9/00(2006.01)I;G06K9/60(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 上海上大专利事务所(普通合伙) 31205 代理人 何文欣
主权项 1.一种优化的人脸识别预处理方法,其特征在于小波分频的基础上,将尺度归一化、灰度归一化以及优化的中值滤波方法融合在一起,对光照不均匀的人脸灰度图像有较好的改善效果,并且提高了复杂光照环境下和不同姿态下的人脸识别的效率;具体操作步骤如下:(1)采集原始人脸图像,(2)图像灰度转换,(3)尺度归一化,(4)两层小波变换,得到低频分量和高频分量,(5)对低频分量进行直方图均衡化,(6)将直方图均衡化的低频分量同高频分量进行小波重构,(7)针对产生的椒盐噪声进行滤波处理,从而得到预处理图像;所述步骤(2)的图像灰度转换是:将原始人脸图像根据公式f(i,j)=0.114×I(i,j,1)+0.587×I(i,j,2)+0.229×I(i,j,3)得到人脸的灰度图像,其中i表示图像的行位置,j表示图像的列位置,f(i,j)表示转换后的灰度图像中第i行第j列的象素的灰度值,I(i,j,1),I(i,j,2)和I(i,j,3)分别表示彩色图像中第i行第j列的象素的R,G,B分量的值;所述步骤(3)的尺度归一化是,尺度归一化采用双线性插值法,输出像素是它在输入图像中2×2领域采样点的平均值,它是根据某像素周围4个像素的灰度值,在水平和垂直两个方向上对其插值;设m<I′<m+1,n<j′<n+1,a=i′-m,b=j′-n,其中I′和j′是要插值点的坐标,则双线性插值的公式为:g(i′,j′)=(1-a)(1-b)g(m,n)+a(1-b)g(m+1,n)+(1-a)bg(m,n+1)+abg(m+1,n+1),按上式计算出来的值赋予图像几何变换对应于(I′,j′)处的像素,即可实现双线性插值;所述步骤(4)中的两层小波变换是:采用Daubechies-2小波进行小波分解,即将第j层的逼近系数分解成j+1层的逼近系数和三个方向的细节系数:水平、垂直和对角方向,设cA<sub>j</sub>f(t)和cD<sub>j</sub>f(t)分别为第j层的粗糙信号和细节信号;cA<sub>j</sub>f(t)可以分解为粗糙像cA<sub>j+1</sub>f(t)和细节cD<sub>j+1</sub>f(t)之和:cA<sub>j</sub>f(t)=cA<sub>j+1</sub>f(t)+cD<sub>j+1</sub>f(t);此外,Daubechies-2小波是目前应用较为广泛的小波,该小波不能用解析式给出,只能通过迭代方法产生,是迭代过程的极限;对128×128的人脸灰度图像进行两层小波变换,分解后得到一个低频分量和六个高频分量,低频部分反映的是人脸图像的平滑区,而边缘、细节、噪声一般都存在于高频部分;所述步骤(5)对低频分量进行直方图均衡化的步骤如下:①统计[0,255]内各灰度像素出现的次数,记为n<sub>i</sub>,i∈[0,255],令n为各灰度级像素总数,记<img file="FSB00000085399800021.GIF" wi="165" he="95" />i∈[0,255];②<img file="FSB00000085399800022.GIF" wi="323" he="120" />即经过灰度映射后得到灰度j;所述步骤(6)中的将直方图均衡化的低频分量同高频分量进行小波重构将直方图均衡化的低频分量同高频分量进行小波重构,其基本过程是分解过程的逆变换;所述步骤(7)针对产生的椒盐噪声进行滤波处理是:用一种基于中值滤波的带有噪声检测步骤的滤波方法进行处理,滤波窗口的大小设定为3×3,窗口范围对应中心像素为xij,具体操作步骤如下:①设滤波判定阈值α,β:图形白椒盐噪声的灰度范围为[255-α,255],黑椒盐噪声的灰度范围为[0,β];②计算窗口像素中值;窗口内的9个像素设为(x<sub>0</sub>,x<sub>1</sub>,...,x<sub>8</sub>),其中,值为med(x<sub>0</sub>,x<sub>1</sub>,...,x<sub>8</sub>);③如果窗口范围内的中心元素x<sub>ij</sub>在[β,α]范围内,x<sub>ij</sub>点是为信号点,则输出原值,相反,则x<sub>ij</sub>点视为噪声点,输出灰度值用med(x<sub>0</sub>,x<sub>1</sub>,...,x<sub>8</sub>)代替。
地址 200444 上海市宝山区上大路99号