发明名称 一种基于分层高斯混合模型的场景识别方法
摘要 本发明公开了一种基于分层高斯混合模型的场景识别方法,包括以下步骤:提取训练图像库中所有图像对应的分层高斯混合模型,并获取分层高斯混合模型的李代数描述子,接收待分类图像,并提取待分类图像的分层高斯混合模型的李代数描述子,用鉴别投影嵌入方法获取待分类图像的分层混合高斯的李代数描述子和训练图像库中所有图像的分层混合高斯的李代数描述子之间的距离,根据得到的距离利用最小中值距离分类器对待分类的图像进行分类,并返回分类结果。本发明优化了图像的分层高斯混合模型的特征表示,从而大大提高了场景识别的性能。
申请公布号 CN102968620A 申请公布日期 2013.03.13
申请号 CN201210464352.3 申请日期 2012.11.16
申请人 华中科技大学 发明人 王天江;刘芳;邵光普;龚立宇;杨勇;许春燕;舒禹程;王明理
分类号 G06K9/00(2006.01)I;G06K9/66(2006.01)I 主分类号 G06K9/00(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 朱仁玲
主权项 1.一种基于分层高斯混合模型的场景识别方法,其特征在于,包括以下步骤: (1)提取训练图像库中所有图像对应的分层高斯混合模型,并获取分层高斯混合模型的李代数描述子,具体包括下述子步骤: (1-1)提取训练图像库中图像的SIFT向量,用主成分分析方法对SIFT向量降维,并结合空间横坐标和纵坐标信息得到最终的D维特征向量,其中D为正整数; (1-2)确定图像对应的分层高斯混合模型所包含的单高斯分量数目K,使用期望最大值算法估计训练图像库中全局混合高斯的极大似然参数{(μ<sub>1</sub>,∑<sub>1</sub>,π<sub>1</sub>),....,(μ<sub>K</sub>,∑<sub>K</sub>,π<sub>K</sub>)},其中μ<sub>i</sub>表示第i个单高斯分量的均值,∑<sub>i</sub>表示第i个单高斯分量的协方差矩阵,π<sub>i</sub>表示第i个单高斯分量在全局混合高斯中所占的比重,且0≤π<sub>i</sub>≤1,1≤i≤K; (1-3)根据全局混合高斯的极大似然参数,采用最大后验概率方法获取每个图像对应的混合高斯参数,其中图像I对应的混合高斯参数<img file="FDA00002417145000011.GIF" wi="807" he="56" />总共有K个高斯分量,其中<img file="FDA00002417145000012.GIF" wi="44" he="52" />和<img file="FDA00002417145000013.GIF" wi="43" he="52" />表示图像I中第i个高斯成分的均值和协方差矩阵,<img file="FDA00002417145000014.GIF" wi="44" he="52" />表示图像I中第i个高斯成分在图像I对应的混合高斯中所占的权重,且<img file="FDA00002417145000015.GIF" wi="200" he="53" />1≤i≤K,K>1;(1-4)根据图像库中所有图像对应的混合高斯参数提取分层混合高斯的李代数描述子; (2)接收待分类图像,并根据步骤(1)提取待分类图像的分层高斯混合模型的李代数描述子<img file="FDA00002417145000016.GIF" wi="830" he="91" />其中I’表示待分类图像;(3)用鉴别投影嵌入方法获取待分类图像的分层混合高斯的李代数描 述子和训练图像库中所有图像的分层混合高斯的李代数描述子之间的距离,具体包括以下子步骤: (3-1)获取训练图像库的投影矩阵<img file="FDA00002417145000021.GIF" wi="846" he="98" />其中如果图像x<sup>s</sup>和x<sup>l</sup>是同一类,则W<sub>sl</sub>=1,否则W<sub>sl</sub>=0,V是由矩阵Φ(A-W)Φ<sup>T</sup>的最大特征值对应的特征向量组成,S为训练图像库图像的数目。Φ=[φ(x<sup>1</sup>),φ(x<sup>2</sup>),....φ(x<sup>S</sup>)],A为对角矩阵,主对角元素<img file="FDA00002417145000022.GIF" wi="328" he="117" />(3-2)获取待分类图像的分层混合高斯的李代数描述子和训练图像库中所有图像的分层混合高斯的李代数描述子之间的距离<img file="FDA00002417145000023.GIF" wi="686" he="52" />(4)根据得到的距离利用最小中值距离分类器对待分类的图像进行分类,并返回分类结果。 
地址 430074 湖北省武汉市洪山区珞喻路1037号