一种频谱和倒谱信息融合的模糊图像检测方法,申请号CN201410599217.9-传众专利搜索

发明名称	一种频谱和倒谱信息融合的模糊图像检测方法
摘要	该发明公开了一种频谱和倒谱信息融合的模糊图像检测方法，属于图像处理技术领域，特别涉及各类模糊图像的检测技术。该方法首先计算图像的能量频谱分布和奇异倒谱值直方图特征，并将上述两特征作为图像的模糊特征；之后，选用支持向量机分类器区分清晰图像和模糊图像特征，利用已采集的带模糊类别标定的图像训练支持向量机分类器的相应参数；最终使用训练好的分类器检测待测试图像是否为模糊图像。上述方法最大的优点在于作为一种非参照模糊图像检测方法，不需要参照图像，因此有非常广泛的应用。同时，由于定义的模糊特征有明确的物理意义，因此能够准确地区分清晰和模糊图像。
申请公布号	CN104282028A	申请公布日期	2015.01.14
申请号	CN201410599217.9	申请日期	2014.10.30
申请人	电子科技大学	发明人	潘力立;郑亚莉
分类号	G06T7/00(2006.01)I;G06K9/66(2006.01)I	主分类号	G06T7/00(2006.01)I
代理机构	电子科技大学专利中心 51203	代理人	张杨
主权项	一种频谱和倒谱信息融合的模糊图像检测方法，该方法包括：步骤1：任意选取摄像头采集的N+M幅同类数字图像<img file="FDA0000597813390000011.GIF" wi="198" he="78" />其中N幅训练样本图像，M幅测试样本图像，训练样本图像和测试样本图像中都包含模糊图像和清晰图像(两者比例接近)，<img file="FDA0000597813390000012.GIF" wi="227" he="75" />代表第n幅大小为P×Q的图像；步骤2：对步骤1中得到的N+M幅数字图像<img file="FDA0000597813390000013.GIF" wi="170" he="84" />根据其模糊与否进行人工标定，若第n幅图像<img file="FDA0000597813390000014.GIF" wi="222" he="78" />为模糊图像，则令其对应的标定变量y<sub>n</sub>＝1，否则y<sub>n</sub>＝‑1；步骤3：对于每一幅数字图像<img file="FDA0000597813390000015.GIF" wi="238" he="78" />I<sub>n</sub>(x,y)表示其中任意一像素点的灰度值，(x,y)为该像素点的坐标位置，进行<img file="FDA0000597813390000016.GIF" wi="218" he="78" />与算子(‑1)<sup>x+y</sup>的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心，得到<img file="FDA0000597813390000017.GIF" wi="255" he="76" />步骤4：对每一变换后的图像<img file="FDA0000597813390000018.GIF" wi="232" he="79" />进行二维离散傅里叶变换，<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>F</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>x</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>P</mi><mo>-</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>y</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>Q</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><msup><mi>I</mi><mo>′</mo></msup><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><msup><mi>e</mi><mrow><mo>-</mo><mi>j</mi><mn>2</mn><mi>π</mi><mrow><mo>(</mo><mfrac><mi>ux</mi><mi>P</mi></mfrac><mo>+</mo><mfrac><mi>vy</mi><mi>Q</mi></mfrac><mo>)</mo></mrow></mrow></msup><mo>,</mo><mi>u</mi><mo>=</mo><mn>0,1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>P</mi><mo>-</mo><mn>1</mn><mo>;</mo><mi>v</mi><mo>=</mo><mn>0,1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>Q</mi><mo>-</mo><mn>1</mn></mrow>]]></math><img file="FDA0000597813390000019.GIF" wi="1774" he="202" /></maths>其中F<sub>n</sub>(u,v)表示I′<sub>n</sub>的二维离散傅里叶变换，u,v为傅里叶变换后的空间坐标；步骤5：计算每一图像<img file="FDA00005978133900000110.GIF" wi="222" he="76" />的能量谱密度分布<img file="FDA00005978133900000111.GIF" wi="571" he="77" />其中：<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>h</mi><mi>nd</mi></msub><mo>=</mo><mfrac><mn>1</mn><msub><mi>N</mi><mi>d</mi></msub></mfrac><munder><mi>Σ</mi><mrow><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>&Element;</mo><msub><mi>R</mi><mi>d</mi></msub></mrow></munder><msup><mrow><mo>\|</mo><msub><mi>F</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>\|</mo></mrow><mn>2</mn></msup><mo>,</mo><mi>d</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>D</mi></mrow>]]></math><img file="FDA00005978133900000112.GIF" wi="991" he="166" /></maths>其中<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>R</mi><mi>d</mi></msub><mo>=</mo><mo>{</mo><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>\|</mo><msub><mi>γ</mi><mrow><mi>d</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>≤</mo><msup><mrow><mo>(</mo><mi>u</mi><mo>-</mo><mfrac><mi>P</mi><mn>2</mn></mfrac><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>v</mi><mo>-</mo><mfrac><mi>Q</mi><mn>2</mn></mfrac><mo>)</mo></mrow><mn>2</mn></msup><mo>≤</mo><msub><mi>γ</mi><mi>d</mi></msub><mo>}</mo></mrow>]]></math><img file="FDA00005978133900000113.GIF" wi="1006" he="127" /></maths>表示第d个频带，γ<sub>d‑1</sub>为d个频带的起始频率，γ<sub>d</sub>为第d个频带的截止频率，N<sub>d</sub>是位于第d个频带内点的数目；步骤6：计算每一图像<img file="FDA00005978133900000114.GIF" wi="220" he="76" />的倒谱<img file="FDA00005978133900000115.GIF" wi="255" he="76" /><img file="FDA00005978133900000125.GIF" wi="649" he="79" />其中<img file="FDA00005978133900000117.GIF" wi="166" he="74" />代表反傅里叶反变换，\|F<sub>n</sub>(u,v)\|为第n幅图像傅里叶变换F<sub>n</sub>(u,v)的模，倒谱具体表达式为：<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>C</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>PQ</mi></mfrac><msubsup><mi>Σ</mi><mrow><mi>u</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>P</mi><mo>-</mo><mn>1</mn></mrow></msubsup><msubsup><mi>Σ</mi><mrow><mi>v</mi><mo>=</mo><mn>0</mn></mrow><mrow><mi>Q</mi><mo>-</mo><mn>1</mn></mrow></msubsup><mi>log</mi><mo>\|</mo><msub><mi>F</mi><mi>n</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>\|</mo><msup><mi>e</mi><mrow><mi>j</mi><mn>2</mn><mi>π</mi><mrow><mo>(</mo><mfrac><mi>ux</mi><mi>P</mi></mfrac><mo>+</mo><mfrac><mi>vy</mi><mi>Q</mi></mfrac><mo>)</mo></mrow></mrow></msup><mo>,</mo><mi>x</mi><mo>=</mo><mn>0,1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>P</mi><mo>-</mo><mn>1</mn><mo>;</mo><mi>y</mi><mo>=</mo><mn>0,1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mi>Q</mi><mo>-</mo><mn>1</mn><mo>;</mo></mrow>]]></math><img file="FDA00005978133900000118.GIF" wi="1971" he="123" /></maths>步骤7：计算每一图像<img file="FDA00005978133900000119.GIF" wi="218" he="88" />对应的奇异倒谱直方图<img file="FDA00005978133900000120.GIF" wi="621" he="76" />s<sub>nl</sub>＝#{C<sub>n</sub>(x,y)\|C<sub>n</sub>(x,y)<0,τ<sub>l‑1</sub>≤C<sub>n</sub>(x,y)≤τ<sub>l</sub>},l＝1,2…,L运算符#表示落入第l个区间的倒谱点的数目，τ<sub>l‑1</sub>和τ<sub>l</sub>分别是第l个倒谱取值区间的开始和结束边界。步骤8：对于每一图像<img file="FDA00005978133900000121.GIF" wi="249" he="78" />定义由能量谱密度分布<img file="FDA00005978133900000122.GIF" wi="188" he="73" />和奇异倒谱直方图<img file="FDA00005978133900000123.GIF" wi="180" he="77" />两种特征级联组成的模糊特征<img file="FDA00005978133900000124.GIF" wi="481" he="77" />步骤9：定义多核函数k(f<sub>m</sub>,f<sub>n</sub>)＝βk’(h<sub>m</sub>,h<sub>n</sub>)+(1‑β)k’(s<sub>m</sub>,s<sub>n</sub>)，其中f<sub>m</sub>,f<sub>n</sub>代表任意两幅图像的模糊特征，h<sub>m</sub>,h<sub>n</sub>代表上述两幅图像的能量谱密度分布特征，s<sub>m</sub>,s<sub>n</sub>代表上述两幅图像的奇异倒谱直方图特征，k’(·,·)为任意满足Mercer定理的核函数；步骤10：选用支持向量机分类器区分清晰和模糊图像，分类器的表达式为：<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><mi>y</mi><mrow><mo>(</mo><mi>f</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>n</mi></msub><msub><mi>y</mi><mi>n</mi></msub><mi>k</mi><mrow><mo>(</mo><mi>f</mi><mo>,</mo><msub><mi>f</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>+</mo><mi>b</mi></mrow>]]></math><img file="FDA0000597813390000021.GIF" wi="624" he="184" /></maths>其中f为测试样本的模糊特征，f<sub>n</sub>为第n个训练样本的模糊特征，<img file="FDA0000597813390000022.GIF" wi="200" he="76" />b以及核函数参数β为分类器参数；参数<img file="FDA0000597813390000023.GIF" wi="166" he="76" />是满足使得下式取最小值的解，<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><munderover><mi>Σ</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>n</mi></msub><mo>-</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><munderover><mi>Σ</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><munderover><mi>Σ</mi><mrow><mi>m</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>n</mi></msub><msub><mi>a</mi><mi>m</mi></msub><msub><mi>y</mi><mi>n</mi></msub><msub><mi>y</mi><mi>m</mi></msub><mi>k</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>n</mi></msub><mo>,</mo><msub><mi>f</mi><mi>m</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000597813390000024.GIF" wi="846" he="188" /></maths>s.t. 0≤a≤C<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>Σ</mi><mrow><mi>n</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></msubsup><msub><mi>a</mi><mi>n</mi></msub><msub><mi>y</mi><mi>n</mi></msub><mo>=</mo><mn>0</mn></mrow>]]></math><img file="FDA0000597813390000025.GIF" wi="331" he="74" /></maths>其中C为支持向量机分类器中控制错分容忍程度的参数，记集合<img file="FDA00005978133900000212.GIF" wi="39" he="54" />为a<sub>n</sub>>0的序号，同时记<img file="FDA00005978133900000213.GIF" wi="62" he="54" />为<img file="FDA00005978133900000214.GIF" wi="39" he="54" />中序号的个数，最后得到b为：<img file="FDA0000597813390000026.GIF" wi="839" he="178" />在实际的实现过程中一般利用LibSVM工具包实现上述计算；步骤11：令步骤7中的参数β取值从0变到1，每次增加0.1，重复步骤10中的支持向量机分类器参数训练过程，并利用步骤1中采集的M幅测试样本图像进行得到参数的测试，M幅测试样本图像对应的模糊特征为<img file="FDA0000597813390000027.GIF" wi="247" he="76" />当y(f<sub>n</sub>)的输出为1时代表模糊图像，输出为0时代表清晰图像，如果此输出类别与原始标定一致则表示正确分类；重复本步骤中的支持向量机分类器训练与测试工作，并记录不同参数β对应的错分测试样本数目，以得到错分测试样本最少时的参数β、<img file="FDA0000597813390000028.GIF" wi="169" he="71" />和b；步骤12：在实际模糊图像辨别过程中，选取步骤11计算得到的参数β、<img file="FDA0000597813390000029.GIF" wi="170" he="76" />和b，按照步骤10的方法来进行图像辨别。
地址	611731 四川省成都市高新区（西区）西源大道2006号