发明名称 基于词袋压缩感知特征提取的人脸识别方法
摘要 本发明公开了一种基于词袋压缩感知特征提取的人脸识别方法,包括人脸识别系统,其特征在于其识别步骤包括:图像的尺度不变特征变换特征提取、特征编码、不同尺度的特征融合和分类。该方法相比于原来的词袋模型,不仅简单实用,而且更有效,用尺度不变特征变换提取图像关键点特征后,不再找聚类中心或者学字典,而是利用随机矩阵。让关键点特征通过与随机矩阵来进行编码,可以节省大量时间,而且没有像原词袋模型方法那样,丢失大量的空间信息。能够很好的克服人脸光照,遮挡以及表情等变化对人脸识别的影响,不仅可以获得较高的识别率,运行速度也较快,在很具有挑战性的AR数据库上进行人脸识别,大大提高了人脸识别率,更具有实时性。
申请公布号 CN104376312A 申请公布日期 2015.02.25
申请号 CN201410739127.5 申请日期 2014.12.08
申请人 广西大学 发明人 周凯;元昌安;郑彦;宋文展
分类号 G06K9/00(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 广西南宁明智专利商标代理有限责任公司 45106 代理人 张智生
主权项 1.一种基于词袋压缩感知特征提取的人脸识别方法,包括人脸识别系统,其特征在于其识别步骤为:步骤一、用尺度不变特征变换特征的方法来提取图像特征;<b> </b>(1)设一幅图像的函数为<img file="599622DEST_PATH_IMAGE001.GIF" wi="48" he="22" />,图像与高斯核函数卷积得到不同尺度下的尺度空间;公式如下:<img file="431050DEST_PATH_IMAGE002.GIF" wi="200" he="22" />(1)其中,<img file="979843DEST_PATH_IMAGE003.GIF" wi="40" he="22" />表示像素位置,<img file="5567DEST_PATH_IMAGE004.GIF" wi="16" he="18" />表示尺度空间,<img file="272601DEST_PATH_IMAGE005.GIF" wi="17" he="16" />表示尺度空间因子;得到图像的尺度空间后,采用<img file="143605DEST_PATH_IMAGE006.GIF" wi="38" he="20" />金字塔方法,即用差分高斯金字塔函数与图像卷积得到的空间<img file="812483DEST_PATH_IMAGE007.GIF" wi="70" he="22" />的方法寻找来寻找极值点,得到<img file="71427DEST_PATH_IMAGE007.GIF" wi="70" he="22" />的公式为:<img file="497860DEST_PATH_IMAGE008.GIF" wi="298" he="46" />(2)其中k是相邻两个不同的尺度空间;(3)根据极值点进而确定关键点,对关键点赋予的一个方向,实现图像的旋转不变性,具体做法为,根据关键点所在的尺度,选择与该尺度最相近的高斯平滑图像<img file="951318DEST_PATH_IMAGE004.GIF" wi="16" he="18" />;计算<img file="412386DEST_PATH_IMAGE004.GIF" wi="16" he="18" />上每一个点<img file="576651DEST_PATH_IMAGE009.GIF" wi="50" he="22" />的梯度与方向;<img file="818276DEST_PATH_IMAGE010.GIF" wi="417" he="30" />(3)<img file="296662DEST_PATH_IMAGE011.GIF" wi="250" he="45" />(4)(4)关键点周围选择一个邻域,以关键点为中心利用所有在此区域内的点的梯度形成一个直方图;并对其中点的梯度做高斯加权;这个邻域划分为四个子区域,在每个子区域取八个方向;从而得到图像的尺度不变特征变换;步骤二、特征编码用分块的方法将图像分割为<img file="674554DEST_PATH_IMAGE012.GIF" wi="44" he="19" />块后,每块用上述的尺度不变特征变换得到图像的局部特征后,利用压缩感知的思想,系统随机生成一个随机字典B,然后通过稀疏表示得到特征编码;假如系统生成的随机字典为,一幅图像<img file="212983DEST_PATH_IMAGE013.GIF" wi="16" he="18" />分割为<img file="676325DEST_PATH_IMAGE014.GIF" wi="20" he="20" />块<img file="456937DEST_PATH_IMAGE015.GIF" wi="101" he="25" />,<img file="954915DEST_PATH_IMAGE016.GIF" wi="16" he="25" />是<img file="398665DEST_PATH_IMAGE013.GIF" wi="16" he="18" />图像尺度不变特征变换提取的第<img file="614883DEST_PATH_IMAGE017.GIF" wi="9" he="18" />块特征,一幅图像的每一局部块通过式(5)可求得特征编码,公式如下:<img file="497388DEST_PATH_IMAGE018.GIF" wi="229" he="42" />(5)其中<img file="787555DEST_PATH_IMAGE019.GIF" wi="16" he="20" />是常数,<img file="464524DEST_PATH_IMAGE020.GIF" wi="14" he="24" />是所求特征编码步骤三、图像中不同尺度的特征融合利用(5)式得到一副图像的特征编码矩阵为<img file="840142DEST_PATH_IMAGE021.GIF" wi="88" he="28" />,<img file="526338DEST_PATH_IMAGE022.GIF" wi="16" he="25" />是对应<img file="733329DEST_PATH_IMAGE016.GIF" wi="16" he="25" />块的系数,为了融合系数用最大池方法,其定义为:<img file="285926DEST_PATH_IMAGE023.GIF" wi="153" he="26" />(6)其中<img file="211157DEST_PATH_IMAGE024.GIF" wi="16" he="25" />是池向量<img file="373148DEST_PATH_IMAGE025.GIF" wi="17" he="18" />的第<img file="700224DEST_PATH_IMAGE026.GIF" wi="9" he="18" />个元素,<img file="984575DEST_PATH_IMAGE027.GIF" wi="21" he="26" />表示系数编码矩阵<img file="69206DEST_PATH_IMAGE020.GIF" wi="14" he="24" />的<img file="97204DEST_PATH_IMAGE026.GIF" wi="9" he="18" />行,<img file="216470DEST_PATH_IMAGE028.GIF" wi="14" he="21" />列;最后使用空间金字塔匹配算法,即将一副图像分割成<img file="671722DEST_PATH_IMAGE029.GIF" wi="34" he="18" />与<img file="7763DEST_PATH_IMAGE030.GIF" wi="34" he="18" />不同的块,就可以对不同空间位置和尺度的子区域进行特征编码,假如使用空间金字塔匹配算法求得该尺度的最大池为<img file="573874DEST_PATH_IMAGE031.GIF" wi="15" he="24" />,然后将不同尺度和区域的特征向量串接起来,最后得到这副图像特征向量;步骤四、分类用上述方法特征提取得到每幅图像的特征向量后,采用核稀疏表示方法来分类,核函数采用直方图交叉核,其表达式如下:<img file="609963DEST_PATH_IMAGE032.GIF" wi="176" he="46" />(7)其中<img file="173800DEST_PATH_IMAGE033.GIF" wi="44" he="26" />是两个维度为<img file="295339DEST_PATH_IMAGE034.GIF" wi="18" he="16" />的特征向量,<img file="602824DEST_PATH_IMAGE035.GIF" wi="40" he="25" />分别是<img file="758999DEST_PATH_IMAGE033.GIF" wi="44" he="26" />特征向量的特征值;假如图像特征提取后得到的训练集为<img file="493737DEST_PATH_IMAGE036.GIF" wi="17" he="18" />,测试样本为<img file="102573DEST_PATH_IMAGE037.GIF" wi="94" he="24" />,以第<img file="10486DEST_PATH_IMAGE026.GIF" wi="9" he="18" />个测试样本为例,<img file="460315DEST_PATH_IMAGE038.GIF" wi="18" he="25" />可以通过矩阵<img file="428271DEST_PATH_IMAGE036.GIF" wi="17" he="18" />核表示为:<img file="462086DEST_PATH_IMAGE039.GIF" wi="280" he="32" />(8)其中<img file="173690DEST_PATH_IMAGE040.GIF" wi="20" he="26" />是核函数<img file="242140DEST_PATH_IMAGE041.GIF" wi="14" he="22" />高维特征投影空间的稀疏系数,将上式展开后得到的式子如下:<img file="380998DEST_PATH_IMAGE042.GIF" wi="410" he="34" />(9)其中<img file="698846DEST_PATH_IMAGE038.GIF" wi="18" he="25" />表示第<img file="151824DEST_PATH_IMAGE026.GIF" wi="9" he="18" />个测试样本,<img file="137098DEST_PATH_IMAGE043.GIF" wi="89" he="32" />表示求<img file="883075DEST_PATH_IMAGE038.GIF" wi="18" he="25" />与<img file="688220DEST_PATH_IMAGE038.GIF" wi="18" he="25" />的直方图交叉核;解式(9)得到系数<img file="679310DEST_PATH_IMAGE044.GIF" wi="17" he="20" />后,最后通过求最小残差<img file="519090DEST_PATH_IMAGE045.GIF" wi="13" he="16" />的来分类:<img file="999750DEST_PATH_IMAGE046.GIF" wi="414" he="65" />(10)式中<img file="495453DEST_PATH_IMAGE047.GIF" wi="24" he="26" />表示第<img file="86971DEST_PATH_IMAGE028.GIF" wi="14" he="21" />类相应的稀疏表示系数。
地址 530004 广西壮族自治区南宁市西乡塘区南宁市大学路100号