发明名称 使用Walsh变换的功率谱来描述图像局部特征区域的方法
摘要 本发明公开了一种使用Walsh变换的功率谱来描述图像局部特征区域的方法,首先规范化图像局部特征区域,并对其分块;然后根据Walsh变换的功率谱生成图像局部特征区域描述子,并对其做归一化处理,最后得到使用Walsh变换功率谱的图像局部特征区域描述子用于描述图像局部特征区域。本发明可以在不大量增加描述子维数和计算量的同时提高描述子的辨识能力,在硬件实现中非常有价值。
申请公布号 CN104200214B 申请公布日期 2016.03.02
申请号 CN201410417637.0 申请日期 2014.08.22
申请人 中国人民解放军国防科学技术大学 发明人 张茂军;王炜;徐玮;熊志辉;谭树人;刘煜;周韬
分类号 G06K9/46(2006.01)I 主分类号 G06K9/46(2006.01)I
代理机构 长沙正奇专利事务所有限责任公司 43113 代理人 卢宏
主权项 一种使用Walsh变换的功率谱来描述图像局部特征区域的方法,其特征在于,包括如下步骤:1)首先规范化图像局部特征区域,并对其分块;对待描述的椭圆形图像局部特征区域进行规范化处理,所述规范化处理包括:首先通过仿射变换将椭圆形图像局部特征区域变换为圆形的图像局部特征区域,再对圆形的图像局部特征区域做旋转变换;再将规范化处理后的图像局部特征区域进行分块,划分为M*M个子区域;其中规范化图像局部特征区域的步骤为:假设椭圆形图像局部特征区域的中心点坐标为c=[c<sub>x</sub>,c<sub>y</sub>]<sup>T</sup>,其中x、y为坐标值,T表示转置,该椭圆形图像局部特征区域上的像素点坐标为X=[x‑c<sub>x</sub>,y‑c<sub>y</sub>]<sup>T</sup>,I(X)表示在坐标X=[x‑c<sub>x</sub>,y‑c<sub>y</sub>]<sup>T</sup>处的图像灰度值,以c=[c<sub>x</sub>,c<sub>y</sub>]<sup>T</sup>为原点,做仿射变换后,X=[x‑c<sub>x</sub>,y‑c<sub>y</sub>]<sup>T</sup>对应的像素点坐标为X'=[x'‑c<sub>x</sub>,y'‑c<sub>y</sub>]<sup>T</sup>,两者之间的对应关系为:X'=A<sup>‑1</sup>XI(X')=I(X)其中,A是一个2*2的对称矩阵,且<img file="FDA0000825375680000011.GIF" wi="230" he="116" />μ是二阶中心矩与原点矩的比值,表现为2*2的矩阵,其4个元素用如下的公式计算:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>&mu;</mi><mn>11</mn></msub><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mi>x</mi></munder><munder><mo>&Sigma;</mo><mi>y</mi></munder><msup><mrow><mo>(</mo><mi>x</mi><mo>-</mo><msub><mi>c</mi><mi>x</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><msub><mi>m</mi><mn>00</mn></msub></mfrac></mrow>]]></math><img file="FDA0000825375680000012.GIF" wi="429" he="191" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>&mu;</mi><mn>22</mn></msub><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mi>x</mi></munder><munder><mo>&Sigma;</mo><mi>y</mi></munder><msup><mrow><mo>(</mo><mi>y</mi><mo>-</mo><msub><mi>c</mi><mi>y</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow><msub><mi>m</mi><mn>00</mn></msub></mfrac></mrow>]]></math><img file="FDA0000825375680000013.GIF" wi="433" he="190" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>&mu;</mi><mn>12</mn></msub><mo>=</mo><msub><mi>&mu;</mi><mn>21</mn></msub><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mi>x</mi></munder><munder><mo>&Sigma;</mo><mi>y</mi></munder><mrow><mo>(</mo><mi>x</mi><mo>-</mo><msub><mi>c</mi><mi>x</mi></msub><mo>)</mo></mrow><mrow><mo>(</mo><mi>y</mi><mo>-</mo><msub><mi>c</mi><mi>y</mi></msub><mo>)</mo></mrow></mrow><msub><mi>m</mi><mn>00</mn></msub></mfrac></mrow>]]></math><img file="FDA0000825375680000021.GIF" wi="667" he="190" /></maths>其中m<sub>00</sub>表示椭圆形的图像局部特征区域的原点矩,s表示仿射变换后圆形图像局部特征区域的半径;而为了使规范后的特征区域具有旋转不变性,还需要再对圆形的图像局部特征区域进行一个旋转变换,即X”=X'R,其中X”=[x”‑c<sub>x</sub>,y”‑c<sub>y</sub>]<sup>T</sup>表示旋转后的图像局部特征区域的像素点坐标,旋转变换矩阵R定义如下:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mi>R</mi><mo>=</mo><mfenced open = "[" close = "]"><mtable><mtr><mtd><mrow><mi>c</mi><mi>o</mi><mi>s</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mo>-</mo><mi>s</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mi>sin</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mtd><mtd><mrow><mi>cos</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000825375680000022.GIF" wi="466" he="151" /></maths>其中θ是特征的主方向,其取值根据检测出的椭圆形图像局部特征区域的长轴确定,考虑到长轴的正负方向并没有得到计算,为了避免对特征描述造成影响,θ一直取α和β两个角度值,其中α和β是椭圆型图像局部特征区域的长轴与坐标系x轴正向的夹角,且α+β=π;2)然后根据Walsh变换的功率谱生成图像局部特征区域描述子,并对其做归一化处理;对于每一个子区域,首先比较每个像素点与其邻近N个像素点的灰度值生成局部二值序列;然后基于序列的列率特性,构造两族局部Walsh谱,将这两族局部Walsh谱的谱点值构成的特征直方图作为子区域的描述子,该描述子是一个3N/2+2维的向量;最后将每个子区域的描述子向量串联起来,得到一个M*M*(3N/2+2)维的向量,将该向量做归一化处理之后,即可以得到使用Walsh变换功率谱的图像局部特征区域描述子,其中子区域的描述子还要生成针对图像局部特征区域的特征描述子:为了进一步降低LWS<sub>N,R</sub>的运算复杂度,对于每个子区域,从S<sub>N,R</sub>(n)的列率特性出发,在获得每个像素点所对应的P<sub>H</sub>(0)和P<sub>H</sub>(p)(p=log<sub>2</sub>N)这两族功率谱后,分别统计子区域内两族功率谱所有可能的取值来构成直方图,记为<img file="FDA0000825375680000031.GIF" wi="167" he="79" />和<img file="FDA0000825375680000032.GIF" wi="198" he="70" />将两个直方图串联起来,即为每个区域的特征描述子;对<img file="FDA0000825375680000033.GIF" wi="166" he="78" />和<img file="FDA0000825375680000034.GIF" wi="171" he="71" />做加权处理,得到的图像局部特征区域描述子<img file="FDA0000825375680000035.GIF" wi="197" he="78" />和<img file="FDA0000825375680000036.GIF" wi="198" he="77" /><maths num="0005" id="cmaths0005"><math><![CDATA[<mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msubsup><mi>NLWS</mi><mrow><mi>N</mi><mo>,</mo><mi>R</mi></mrow><mn>0</mn></msubsup><mrow><mo>(</mo><msub><mi>l</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>=</mo><mo>&Sigma;</mo><mo>&Sigma;</mo><mi>q</mi><mrow><mo>(</mo><mrow><mo>(</mo><mrow><msub><mi>P</mi><mi>H</mi></msub><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow><mo>,</mo><msub><mi>l</mi><mn>0</mn></msub></mrow><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><msubsup><mi>NLWS</mi><mrow><mi>N</mi><mo>,</mo><mi>R</mi></mrow><mi>p</mi></msubsup><mrow><mo>(</mo><msub><mi>l</mi><mi>p</mi></msub><mo>)</mo></mrow><mo>=</mo><mo>&Sigma;</mo><mo>&Sigma;</mo><mi>q</mi><mrow><mo>(</mo><mrow><mo>(</mo><mrow><msub><mi>P</mi><mi>H</mi></msub><mrow><mo>(</mo><mi>p</mi><mo>)</mo></mrow><mo>,</mo><msub><mi>l</mi><mi>p</mi></msub></mrow><mo>)</mo></mrow><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced>]]></math><img file="FDA0000825375680000037.GIF" wi="710" he="182" /></maths>其中<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>q</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>N</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><msub><mi>g</mi><mi>i</mi></msub><mo>-</mo><msub><mi>g</mi><mi>c</mi></msub><mo>|</mo></mrow></mtd><mtd><mrow><mi>x</mi><mo>=</mo><mi>y</mi></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>x</mi><mo>&NotEqual;</mo><mi>y</mi></mrow></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000825375680000038.GIF" wi="685" he="222" /></maths>g<sub>c</sub>为中心像素点的灰度值,g<sub>i</sub>为邻近第i(i=0,…,N‑1)个像素点的灰度值,l<sub>0</sub>表示P<sub>H</sub>(0)所有可能的取值,l<sub>p</sub>表示P<sub>H</sub>(p)(p=log<sub>2</sub>N)所有可能的取值。
地址 410073 湖南省长沙市开福区德雅路109号