发明名称 一种基于复合梯度向量的人脸识别方法
摘要 本发明属于模式识别技术领域,具体涉及一种基于复合梯度向量的人脸识别方法,该方法首先在定位后的人脸图像中标定目标区域,并在目标区域内划分特征子区域,然后以特征子区域的边缘奇异点作为向量的起点和终点进行正交采样得到基向量,将目标区域内所有基向量组建向量簇,通过对基向量的多维复合得到向量簇内所有极大梯度向量,最后以极大梯度向量作为元素组建复合梯度向量并统计复合梯度向量的维度和梯度信息,将复合梯度向量、复合梯度向量维度和梯度进行人脸库对比,识别出人脸身份,本发明提供的人脸识别方法比其它人脸识别方法具有更强的环境适应性和特征提取能力,在光照强度变化、多姿态、多表情条件下,具有较高识别性能,可用于生物特征识别领域中大范围复杂环境下的人脸识别。
申请公布号 CN102324022B 申请公布日期 2013.03.20
申请号 CN201110259963.X 申请日期 2011.09.05
申请人 辽宁工程技术大学 发明人 王志宏;袁姮;姜文涛
分类号 G06K9/00(2006.01)I;G06K9/64(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 阜新市和达专利事务所 21206 代理人 邢志宏;赵景浦
主权项 1.一种基于复合梯度向量的人脸识别方法,其特征在于它包含特征提取、向量融合和人脸识别三个阶段;(1)本阶段为特征提取阶段,主要目的是提取待识别人脸的特征信息;归一化待识别的人脸图像,得到目标区域<img file="201110259963X100001DEST_PATH_IMAGE001.GIF" wi="76" he="20" />,其中<img file="201110259963X100001DEST_PATH_IMAGE002.GIF" wi="16" he="18" />为包含了人脸主要信息的目标区域,<img file="201110259963X100001DEST_PATH_IMAGE003.GIF" wi="22" he="18" />为目标区域宽度,<img file="201110259963X100001DEST_PATH_IMAGE004.GIF" wi="20" he="20" />为目标区域长度;计算各灰度阶对应像素的分布概率和信息熵值,并统计信息熵分布和一维信息熵的极值点;以信息熵分布中取得极大值时所对应的灰度阶作为目标区域的分割阈值,划分分散特征子区域,分散特征子区域的边缘像素点为奇异点;正交采样目标区域<img file="385632DEST_PATH_IMAGE002.GIF" wi="16" he="18" />内的基向量<img file="201110259963X100001DEST_PATH_IMAGE005.GIF" wi="25" he="26" />,以宽度中心的像素点作为起始点,垂直向下搜索奇异点,并将搜索到的第一个奇异点作为终点,建立第一个基向量<img file="201110259963X100001DEST_PATH_IMAGE006.GIF" wi="24" he="25" />;以基向量<img file="237526DEST_PATH_IMAGE006.GIF" wi="24" he="25" />的终点作为起点,分别垂直向左、下、右的逆时针方向搜索下一个奇异点,并将每个方向上搜索到的第一个奇异点作为终点分别建立第一个基向量的三个后继向量,直至目标区域T的边缘仍未发现奇异点,则不建立该方向的基向量;以建立的所有基向量的终点作为起点再分别垂直向左、下、右、上的逆时针方向搜索奇异点,并将搜索到的第一个奇异点作为终点分别建立基向量,每个奇异点只需搜索三个方向,其起点方向忽略,且直至目标区域<img file="17263DEST_PATH_IMAGE002.GIF" wi="16" he="18" />的边缘仍未发现奇异点,则不建立该方向的基向量;当所有起点的各个方向均已到达目标区域<img file="225521DEST_PATH_IMAGE002.GIF" wi="16" he="18" />的边缘都搜索不到奇异点,停止搜索,此时已经采样得到目标区域内所有基向量;对于目标区域内的基向量<img file="201110259963X100001DEST_PATH_IMAGE007.GIF" wi="125" he="42" />,其中<img file="201110259963X100001DEST_PATH_IMAGE008.GIF" wi="24" he="21" />为整数,<img file="201110259963X100001DEST_PATH_IMAGE009.GIF" wi="13" he="19" />和<img file="201110259963X100001DEST_PATH_IMAGE010.GIF" wi="18" he="21" />表示基向量<img file="915260DEST_PATH_IMAGE005.GIF" wi="25" he="26" />在向量簇中的位置是第<img file="800039DEST_PATH_IMAGE009.GIF" wi="13" he="19" />行、第<img file="67072DEST_PATH_IMAGE010.GIF" wi="18" he="21" />列,向量簇的内容详见向量融合阶段,<img file="201110259963X100001DEST_PATH_IMAGE011.GIF" wi="50" he="25" />,<img file="DEST_PATH_IMAGE012.GIF" wi="60" he="22" />,基向量<img file="141339DEST_PATH_IMAGE005.GIF" wi="25" he="26" />维度记为<img file="201110259963X100001DEST_PATH_IMAGE013.GIF" wi="69" he="26" />,梯度记为<img file="DEST_PATH_IMAGE014.GIF" wi="50" he="26" />,当基向量<img file="620337DEST_PATH_IMAGE005.GIF" wi="25" he="26" />的终点是基向量<img file="201110259963X100001DEST_PATH_IMAGE015.GIF" wi="36" he="25" /><img file="DEST_PATH_IMAGE016.GIF" wi="53" he="25" />的起点,称<img file="489067DEST_PATH_IMAGE005.GIF" wi="25" he="26" />为<img file="243397DEST_PATH_IMAGE015.GIF" wi="36" he="25" />的前趋向量,<img file="42725DEST_PATH_IMAGE015.GIF" wi="36" he="25" />为<img file="566111DEST_PATH_IMAGE005.GIF" wi="25" he="26" />的后继向量,无前驱向量的基向量称为向量簇的根向量,无后继向量的基向量称为向量簇的叶向量,基向量<img file="201110259963X100001DEST_PATH_IMAGE017.GIF" wi="25" he="26" />称为向量簇的根向量;(2)本阶段为向量融合阶段,主要目的是将待识别人脸的特征信息进行融合,得到其最大约束特征信息;将采样得到的基向量组建向量簇<img file="DEST_PATH_IMAGE018.GIF" wi="120" he="22" />,其中<img file="201110259963X100001DEST_PATH_IMAGE019.GIF" wi="29" he="20" />是基向量的集合,<img file="DEST_PATH_IMAGE020.GIF" wi="30" he="20" />是基向量间相互关系的集合,并标定基向量、记录基向量前驱和后继约束关系、提取基向量维度和梯度信息;将向量簇中基向量的标定、约束关系、纬度和梯度信息分别用结构矩阵<img file="201110259963X100001DEST_PATH_IMAGE021.GIF" wi="33" he="20" />、约束矩阵<img file="DEST_PATH_IMAGE022.GIF" wi="36" he="20" />、维度矩阵<img file="201110259963X100001DEST_PATH_IMAGE023.GIF" wi="40" he="18" />和梯度矩阵<img file="DEST_PATH_IMAGE024.GIF" wi="36" he="20" />表示;<img file="201110259963X100001DEST_PATH_IMAGE025.GIF" wi="525" he="113" /><img file="DEST_PATH_IMAGE026.GIF" wi="427" he="100" /><img file="201110259963X100001DEST_PATH_IMAGE027.GIF" wi="314" he="102" /><img file="DEST_PATH_IMAGE028.GIF" wi="318" he="102" />其中<img file="201110259963X100001DEST_PATH_IMAGE029.GIF" wi="32" he="18" />为整数,<img file="DEST_PATH_IMAGE030.GIF" wi="23" he="16" />和<img file="201110259963X100001DEST_PATH_IMAGE031.GIF" wi="18" he="16" />表示基向量<img file="DEST_PATH_IMAGE032.GIF" wi="30" he="26" />在向量簇中的位置是第<img file="517928DEST_PATH_IMAGE030.GIF" wi="23" he="16" />行、第<img file="759553DEST_PATH_IMAGE031.GIF" wi="18" he="16" />列,<img file="201110259963X100001DEST_PATH_IMAGE033.GIF" wi="54" he="22" />,<img file="DEST_PATH_IMAGE034.GIF" wi="120" he="25" />,<img file="201110259963X100001DEST_PATH_IMAGE035.GIF" wi="102" he="25" />,<img file="DEST_PATH_IMAGE036.GIF" wi="98" he="22" />,<img file="201110259963X100001DEST_PATH_IMAGE037.GIF" wi="100" he="25" />,<img file="DEST_PATH_IMAGE038.GIF" wi="60" he="22" />;在结构矩阵中,第一行的元素<img file="723092DEST_PATH_IMAGE017.GIF" wi="25" he="26" />为向量簇的根向量,第二行的元素是基向量<img file="201110259963X100001DEST_PATH_IMAGE039.GIF" wi="26" he="26" />、<img file="DEST_PATH_IMAGE040.GIF" wi="28" he="26" />和<img file="201110259963X100001DEST_PATH_IMAGE041.GIF" wi="28" he="26" />,均是<img file="239000DEST_PATH_IMAGE017.GIF" wi="25" he="26" />的后继向量,并以三者为根向量的子向量簇<img file="DEST_PATH_IMAGE042.GIF" wi="78" he="24" />、<img file="201110259963X100001DEST_PATH_IMAGE043.GIF" wi="81" he="24" />、<img file="DEST_PATH_IMAGE044.GIF" wi="85" he="25" />在向量簇中的顺序分别是垂直向左、下、右的逆时针方向,基向量<img file="201110259963X100001DEST_PATH_IMAGE045.GIF" wi="61" he="26" />,按逆时针方向分别复合向量<img file="DEST_PATH_IMAGE046.GIF" wi="25" he="22" />、<img file="201110259963X100001DEST_PATH_IMAGE047.GIF" wi="22" he="22" />和<img file="DEST_PATH_IMAGE048.GIF" wi="25" he="22" />得到其后继向量<img file="201110259963X100001DEST_PATH_IMAGE049.GIF" wi="93" he="26" />,<img file="DEST_PATH_IMAGE050.GIF" wi="92" he="26" />,<img file="201110259963X100001DEST_PATH_IMAGE051.GIF" wi="94" he="26" />,结构矩阵的第<img file="201110259963X100001DEST_PATH_IMAGE053.GIF" wi="9" he="18" />行、第<img file="DEST_PATH_IMAGE054.GIF" wi="26" he="21" />列的基向量<img file="201110259963X100001DEST_PATH_IMAGE055.GIF" wi="26" he="26" />有三个后继向量<img file="DEST_PATH_IMAGE056.GIF" wi="37" he="26" />、<img file="201110259963X100001DEST_PATH_IMAGE057.GIF" wi="46" he="26" />和<img file="DEST_PATH_IMAGE058.GIF" wi="49" he="26" /><img file="201110259963X100001DEST_PATH_IMAGE059.GIF" wi="56" he="25" />,且三者在向量簇中是按照垂直向左、下、右、上的逆时针方向排列的,那么有<img file="DEST_PATH_IMAGE060.GIF" wi="105" he="26" />,<img file="201110259963X100001DEST_PATH_IMAGE061.GIF" wi="113" he="26" />,<img file="DEST_PATH_IMAGE062.GIF" wi="117" he="26" />;在约束矩阵中,元素是二元组,二元组的元是基向量,二元组<img file="201110259963X100001DEST_PATH_IMAGE063.GIF" wi="84" he="28" />的第一元<img file="DEST_PATH_IMAGE064.GIF" wi="41" he="26" />是第二元<img file="201110259963X100001DEST_PATH_IMAGE065.GIF" wi="30" he="26" />的前驱向量,<img file="10384DEST_PATH_IMAGE065.GIF" wi="30" he="26" />是<img file="739306DEST_PATH_IMAGE064.GIF" wi="41" he="26" />的后继向量;在维度矩阵和梯度矩阵中,对应于结构矩阵的第<img file="631170DEST_PATH_IMAGE053.GIF" wi="9" he="18" />行、第<img file="DEST_PATH_IMAGE066.GIF" wi="14" he="21" />列的基向量<img file="191464DEST_PATH_IMAGE055.GIF" wi="26" he="26" />,维度矩阵的第<img file="963111DEST_PATH_IMAGE053.GIF" wi="9" he="18" />行、第<img file="913749DEST_PATH_IMAGE066.GIF" wi="14" he="21" />列的元素为基向量<img file="609304DEST_PATH_IMAGE055.GIF" wi="26" he="26" />的维度<img file="201110259963X100001DEST_PATH_IMAGE067.GIF" wi="48" he="28" />,梯度矩阵的第<img file="24105DEST_PATH_IMAGE053.GIF" wi="9" he="18" />行、第<img file="966653DEST_PATH_IMAGE066.GIF" wi="14" he="21" />列的元素为基向量<img file="214707DEST_PATH_IMAGE055.GIF" wi="26" he="26" />的梯度<img file="DEST_PATH_IMAGE068.GIF" wi="50" he="28" />;搜索约束矩阵,寻找在矩阵中只充当二元组的第二元而未充当第一元的基向量,该类基向量称为叶向量;在约束矩阵中,搜索以叶向量为第二元的二元组,记录该二元组的第一元基向量,该第一元基向量称为叶向量的前驱向量;搜索叶向量前驱向量的前驱向量,直至搜索到的向量为根向量,停止搜索过程,记录从叶向量到根向量的路径<img file="201110259963X100001DEST_PATH_IMAGE069.GIF" wi="104" he="26" />;将路径上所有的基向量进行多维复合,得到目标区域内所有的极大梯度向量<img file="DEST_PATH_IMAGE070.GIF" wi="245" he="49" />,其中<img file="201110259963X100001DEST_PATH_IMAGE071.GIF" wi="57" he="25" />,<img file="510690DEST_PATH_IMAGE011.GIF" wi="50" he="25" />,<img file="DEST_PATH_IMAGE072.GIF" wi="29" he="19" />,<img file="201110259963X100001DEST_PATH_IMAGE073.GIF" wi="13" he="16" />和<img file="DEST_PATH_IMAGE074.GIF" wi="13" he="23" />表示基向量<img file="201110259963X100001DEST_PATH_IMAGE075.GIF" wi="30" he="28" />在向量簇中的位置是第<img file="DEST_PATH_IMAGE076.GIF" wi="17" he="16" />行、第<img file="201110259963X100001DEST_PATH_IMAGE077.GIF" wi="17" he="22" />列,符号<img file="DEST_PATH_IMAGE078.GIF" wi="18" he="20" />为复合,复合向量<img file="201110259963X100001DEST_PATH_IMAGE079.GIF" wi="33" he="22" />和<img file="DEST_PATH_IMAGE080.GIF" wi="34" he="22" />为<img file="201110259963X100001DEST_PATH_IMAGE081.GIF" wi="140" he="22" />,<img file="DEST_PATH_IMAGE082.GIF" wi="25" he="24" />为连续复合,极大梯度向量<img file="201110259963X100001DEST_PATH_IMAGE083.GIF" wi="37" he="29" />的维度为<img file="DEST_PATH_IMAGE084.GIF" wi="142" he="49" />,梯度为<img file="201110259963X100001DEST_PATH_IMAGE085.GIF" wi="146" he="49" />,即得到人脸面部最大约束特征信息;以向量簇的所有极大梯度向量为元素进行融合得到人脸面部的复合梯度向量<img file="DEST_PATH_IMAGE086.GIF" wi="250" he="44" />,其中<img file="201110259963X100001DEST_PATH_IMAGE087.GIF" wi="14" he="16" />为极大梯度向量的数量,<img file="DEST_PATH_IMAGE088.GIF" wi="136" he="26" />,<img file="201110259963X100001DEST_PATH_IMAGE089.GIF" wi="113" he="25" />,复合梯度向量的维度记为<img file="DEST_PATH_IMAGE090.GIF" wi="186" he="50" />,梯度记为<img file="201110259963X100001DEST_PATH_IMAGE091.GIF" wi="190" he="50" />;(3)本阶段为人脸识别阶段,主要目的是匹配待识别人脸与数据库存储的各人脸的最大约束特征信息,识别出人脸身份;人脸库中存储的人脸图像的数量为<img file="357161DEST_PATH_IMAGE087.GIF" wi="14" he="16" />,其复合梯度向量分别为<img file="DEST_PATH_IMAGE092.GIF" wi="62" he="25" />,维度分别为<img file="201110259963X100001DEST_PATH_IMAGE093.GIF" wi="60" he="25" />,梯度为<img file="DEST_PATH_IMAGE094.GIF" wi="64" he="25" />,待识别人脸的复合梯度向量、维度信息和梯度信息分别为<img file="201110259963X100001DEST_PATH_IMAGE095.GIF" wi="60" he="30" />、<img file="DEST_PATH_IMAGE096.GIF" wi="80" he="30" />和<img file="201110259963X100001DEST_PATH_IMAGE097.GIF" wi="82" he="30" />,计算<img file="DEST_PATH_IMAGE098.GIF" wi="130" he="32" />和<img file="201110259963X100001DEST_PATH_IMAGE099.GIF" wi="290" he="32" />,其中<img file="DEST_PATH_IMAGE100.GIF" wi="66" he="22" />, 统计<img file="DEST_PATH_IMAGE101.GIF" wi="16" he="25" />与<img file="DEST_PATH_IMAGE102.GIF" wi="17" he="25" />的最小值,即可判断待测图像的人脸身份。
地址 125105 辽宁省葫芦岛市龙湾南大街188号辽宁工程技术大学
您可能感兴趣的专利