发明名称 基于视觉注意机制的纸病检测方法
摘要 本发明的基于视觉注意机制的纸病检测方法,属于造纸技术领域,本发明通过对人眼视觉注意机制研究,提出了一种新的基于视觉注意机制的纸病检测方法,人眼观察一幅含有纸病的图像,可以很容易找出来,其原因是纸病相对于背景纹理而言是最容易吸引人眼注意的,通过模拟人眼视觉注意机制,建立基于视觉注意机制的纸病检测计算模型,与传统纸病检测方法相比,本发明所提供的方法检测鲁棒性强、速度快,不需要进行阈值计算,自适应进行纸病区域计算,可以满足不同背景条件下的纸病检测需求,如纺织业、卷烟纸业等。
申请公布号 CN105160651A 申请公布日期 2015.12.16
申请号 CN201510395916.6 申请日期 2015.07.05
申请人 济南大学 发明人 蒋萍;王司光;孟宪浩
分类号 G06T7/00(2006.01)I;G06T7/40(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 四川君士达律师事务所 51216 代理人 芶忠义
主权项 基于视觉注意机制的纸病检测方法,其特征是:具体步骤为:第一步:多尺度采样及线性滤波,多尺度采样是从原始输入图像最底层开始,由下到上,依次每一层图像是通过对其相邻下层图像采样获取,原始图像为0尺度,则每采样一次尺度加1,图像的分辨率随着尺度的增加以2的因子递减,在计算过程中尺度定义为共5个尺度,本发明采用Gaussian滤波器对采用图像进行滤波,令{x<sub>ij</sub>}表示原始图像,x<sub>ij</sub>表示图像中坐标(i,j)处的灰度值,则对图像中的每一点采用公式进行类高斯卷积计算<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msubsup><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msubsup><mo>=</mo><msub><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow>]]></math><img file="FDA0000753173420000011.GIF" wi="193" he="91" /></maths><maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msubsup><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msubsup><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>p</mi><mo>=</mo><mo>-</mo><mn>2</mn></mrow><mrow><mi>p</mi><mo>=</mo><mn>2</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>q</mi><mo>=</mo><mo>-</mo><mn>2</mn></mrow><mrow><mi>q</mi><mo>=</mo><mn>2</mn></mrow></munderover><msub><mi>g</mi><mrow><mi>p</mi><mi>q</mi></mrow></msub><msubsup><mi>x</mi><mrow><mi>i</mi><mo>-</mo><mi>p</mi><mo>,</mo><mi>j</mi><mo>-</mo><mi>q</mi></mrow><mrow><mo>(</mo><mn>0</mn><mo>)</mo></mrow></msubsup></mrow>]]></math><img file="FDA0000753173420000012.GIF" wi="512" he="171" /></maths>…<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msubsup><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow></msubsup><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>p</mi><mo>=</mo><mo>-</mo><mn>2</mn></mrow><mrow><mi>p</mi><mo>=</mo><mn>2</mn></mrow></munderover><munderover><mo>&Sigma;</mo><mrow><mi>q</mi><mo>=</mo><mo>-</mo><mn>2</mn></mrow><mrow><mi>q</mi><mo>=</mo><mn>2</mn></mrow></munderover><msub><mi>g</mi><mrow><mi>p</mi><mi>q</mi></mrow></msub><msubsup><mi>x</mi><mrow><mi>i</mi><mo>-</mo><mi>p</mi><mo>,</mo><mi>j</mi><mo>-</mo><mi>q</mi></mrow><mrow><mo>(</mo><mi>&sigma;</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></msubsup></mrow>]]></math><img file="FDA0000753173420000013.GIF" wi="527" he="168" /></maths>其中,卷积矩阵[g<sub>pq</sub>]为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mo>&lsqb;</mo><msub><mi>g</mi><mrow><mi>p</mi><mi>q</mi></mrow></msub><mo>&rsqb;</mo><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mn>4</mn></mtd><mtd><mn>6</mn></mtd><mtd><mn>4</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>4</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>24</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>4</mn></mtd></mtr><mtr><mtd><mn>6</mn></mtd><mtd><mn>24</mn></mtd><mtd><mn>36</mn></mtd><mtd><mn>24</mn></mtd><mtd><mn>6</mn></mtd></mtr><mtr><mtd><mn>4</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>24</mn></mtd><mtd><mn>16</mn></mtd><mtd><mn>4</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mn>4</mn></mtd><mtd><mn>6</mn></mtd><mtd><mn>4</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced><mo>,</mo><mrow><mo>(</mo><mi>p</mi><mo>,</mo><mi>q</mi><mo>=</mo><mo>-</mo><mn>2</mn><mo>,</mo><mo>-</mo><mn>1</mn><mo>,</mo><mn>0</mn><mo>,</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000753173420000014.GIF" wi="875" he="325" /></maths>第二步:分别提取亮度、颜色和朝向特征图,亮度特征图FM<sub>I</sub>(σ)=(r(σ)+g(σ)+b(σ))/3其中,FM<sub>I</sub>(σ)表示σ尺度下亮度特征图,r(σ)、g(σ)、b(σ)分别表示σ尺度下输入图像的红、绿、蓝三通道信息,颜色特征图用红‑绿(Red‑Green,RG)和黄‑蓝(Yellow‑Blue,BY)颉颃对来表示其特征;<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msubsup><mi>FM</mi><mi>C</mi><mrow><mi>r</mi><mi>g</mi></mrow></msubsup><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>r</mi><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>-</mo><mi>g</mi><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow></mrow><mrow><mi>m</mi><mi>a</mi><mi>x</mi><mrow><mo>(</mo><mi>r</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>,</mo><mi>g</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>,</mo><mi>b</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000753173420000015.GIF" wi="675" he="137" /></maths><maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msubsup><mi>FM</mi><mi>C</mi><mrow><mi>b</mi><mi>y</mi></mrow></msubsup><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>b</mi><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>-</mo><mi>m</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>r</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>,</mo><mi>g</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>)</mo></mrow></mrow><mrow><mi>m</mi><mi>a</mi><mi>x</mi><mrow><mo>(</mo><mi>r</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>,</mo><mi>g</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>,</mo><mi>b</mi><mo>(</mo><mi>&sigma;</mi><mo>)</mo><mo>)</mo></mrow></mrow></mfrac></mrow>]]></math><img file="FDA0000753173420000016.GIF" wi="613" he="134" /></maths>朝向特征图<maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>FM</mi><mi>O</mi><mi>&theta;</mi></msubsup><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><mo>|</mo><msub><mi>F</mi><mi>I</mi></msub><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>*</mo><msub><mi>G</mi><mn>0</mn></msub><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>+</mo><mo>|</mo><mo>|</mo><msub><mi>F</mi><mi>I</mi></msub><mrow><mo>(</mo><mi>&sigma;</mi><mo>)</mo></mrow><mo>*</mo><msub><mi>G</mi><mrow><mi>&pi;</mi><mo>/</mo><mn>2</mn></mrow></msub><mrow><mo>(</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo><mo>,</mo></mrow>]]></math><img file="FDA0000753173420000021.GIF" wi="939" he="100" /></maths>其中,<img file="FDA0000753173420000029.GIF" wi="147" he="78" />为Gabor函数,<img file="FDA0000753173420000022.GIF" wi="296" he="84" />θ∈{0°,45°,90°,135°},<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>G</mi><mi>&phi;</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>,</mo><mi>&theta;</mi><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><msup><mi>x</mi><mrow><mo>&prime;</mo><mn>2</mn></mrow></msup><mo>+</mo><msup><mi>&gamma;</mi><mn>2</mn></msup><msup><mi>y</mi><mrow><mo>&prime;</mo><mn>2</mn></mrow></msup></mrow><mrow><mn>2</mn><msup><mi>&delta;</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mi>c</mi><mi>o</mi><mi>s</mi><mrow><mo>(</mo><mn>2</mn><mi>&pi;</mi><mfrac><msup><mi>x</mi><mo>&prime;</mo></msup><mi>&lambda;</mi></mfrac><mo>+</mo><mi>&psi;</mi><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0000753173420000023.GIF" wi="909" he="139" /></maths>x'=xcos(θ)‑ysin(θ);y'=‑xsin(θ)‑ycos(θ)本发明选取γ=1,λ=7,滤波器取为一个19×19的矩阵,δ表示感受野的作用范围,δ取不同的值时可得到不同的Gabor模板,δ太大时会加强余弦函数的作用,高斯函数作用不明显,每个像素点在滤波中的作用几乎都一样,δ太小时,滤波作用只表现在模板的中间区域,领域点在滤波中几乎不起作用,只有δ取值适中时Gabor函数才能发挥其获取朝向的作用,经过实验比较本发明选取δ=3.5;第三步:分别提取亮度、颜色和朝向特征对比映射图,通过对不同尺度下的特征图做差获取特征对比映射图,首先,将不同尺度的特征图通过插值或抽取变为同一尺度下的信息,然后,进行点对点减法运算,设中心为c,周边为s,记中央‑周边差操作为Θ,则亮度、颜色和朝向对比映射图可分别求得:CM<sub>I</sub>(c,s)=|FM<sub>I</sub>(c)ΘFM<sub>I</sub>(s)|<maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msubsup><mi>CM</mi><mi>C</mi><mi>rg</mi></msubsup><mrow><mo>(</mo><mi>c</mi><mo>,</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><msubsup><mi>FM</mi><mi>C</mi><mi>rg</mi></msubsup><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><mi>&Theta;</mi><msubsup><mi>FM</mi><mi>C</mi><mi>rg</mi></msubsup><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>|</mo></mrow>]]></math><img file="FDA0000753173420000027.GIF" wi="772" he="92" /></maths><maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><msubsup><mi>CM</mi><mi>C</mi><mrow><mi>b</mi><mi>y</mi></mrow></msubsup><mrow><mo>(</mo><mi>c</mi><mo>,</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><msubsup><mi>FM</mi><mi>C</mi><mrow><mi>b</mi><mi>y</mi></mrow></msubsup><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><msubsup><mi>&Theta;FM</mi><mi>C</mi><mrow><mi>b</mi><mi>y</mi></mrow></msubsup><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>|</mo></mrow>]]></math><img file="FDA0000753173420000028.GIF" wi="777" he="90" /></maths><maths num="0011" id="cmaths0011"><math><![CDATA[<mrow><msubsup><mi>CM</mi><mi>O</mi><mi>&theta;</mi></msubsup><mrow><mo>(</mo><mi>c</mi><mo>,</mo><mi>s</mi><mo>)</mo></mrow><mo>=</mo><mo>|</mo><msubsup><mi>FM</mi><mi>O</mi><mi>&theta;</mi></msubsup><mrow><mo>(</mo><mi>c</mi><mo>)</mo></mrow><msubsup><mi>&Theta;FM</mi><mi>O</mi><mi>&theta;</mi></msubsup><mrow><mo>(</mo><mi>s</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>]]></math><img file="FDA0000753173420000026.GIF" wi="680" he="100" /></maths>第四步:获取亮度、颜色和朝向子显著图,对所有的特征信息,如果直接合并所有尺度下的对比映射图来获取子显著图,则所得到的子显著图特征可能由于噪音的影响弱化了自身比较显著的信息,因此,本发明在获取子显著图之前首先对对比映射图进行归一化处理,用“N(·)”来表示归一化,包括三个步骤:将对比映射图的信息归一化到[0…K]范围内,目的是消除由于不同特征的特征提取方法不同,而引起的各个特征显著图的最大值不同的问题;对每一幅特征图,计算图像中除去全局极大值点K之外的剩余部分的所有局部极大点的平均值<img file="FDA0000753173420000035.GIF" wi="75" he="84" />计算<img file="FDA0000753173420000034.GIF" wi="200" he="87" />所得到的值就是该特征显著图的加权合并系数,按照以上步骤即可分别得到亮度、颜色和朝向子显著图,<maths num="0012" id="cmaths0012"><math><![CDATA[<mrow><mover><mi>C</mi><mo>&OverBar;</mo></mover><msub><mi>M</mi><mi>I</mi></msub><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>c</mi><mo>&Element;</mo><mo>{</mo><mn>0</mn><mo>,</mo><mn>1</mn><mo>}</mo><mo>,</mo><mi>s</mi><mo>&Element;</mo><mo>{</mo><mn>2</mn><mo>,</mo><mn>3</mn><mo>,</mo><mn>4</mn><mo>}</mo></mrow></munder><mi>N</mi><mrow><mo>(</mo><msub><mi>CM</mi><mi>I</mi></msub><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi></mrow><mo>)</mo><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000753173420000031.GIF" wi="590" he="129" /></maths><maths num="0013" id="cmaths0013"><math><![CDATA[<mrow><mover><mi>C</mi><mo>&OverBar;</mo></mover><msub><mi>M</mi><mi>C</mi></msub><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>c</mi><mo>&Element;</mo><mo>{</mo><mn>0</mn><mo>,</mo><mn>1</mn><mo>}</mo><mo>,</mo><mi>s</mi><mo>&Element;</mo><mo>{</mo><mn>2</mn><mo>,</mo><mn>3</mn><mo>,</mo><mn>4</mn><mo>}</mo></mrow></munder><mi>N</mi><mrow><mo>(</mo><msubsup><mi>CM</mi><mi>c</mi><mrow><mi>r</mi><mi>g</mi></mrow></msubsup><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi></mrow><mo>)</mo><mo>)</mo></mrow><mo>+</mo><munder><mo>&Sigma;</mo><mrow><mi>c</mi><mo>&Element;</mo><mo>{</mo><mn>0</mn><mo>,</mo><mn>1</mn><mo>}</mo><mo>,</mo><mi>s</mi><mo>&Element;</mo><mo>{</mo><mn>2</mn><mo>,</mo><mn>3</mn><mo>,</mo><mn>4</mn><mo>}</mo></mrow></munder><mi>N</mi><mrow><mo>(</mo><msubsup><mi>CM</mi><mi>C</mi><mrow><mi>b</mi><mi>y</mi></mrow></msubsup><mo>(</mo><mrow><mi>c</mi><mo>,</mo><mi>s</mi></mrow><mo>)</mo><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000753173420000032.GIF" wi="990" he="108" /></maths><img file="FDA0000753173420000033.GIF" wi="1038" he="138" />第五步:获取全局显著图,按同样的方法对亮度、颜色和朝向信息的子显著图进行归一化处理,然后进行合并得到全局显著图;第六步:纸病区域计算,纸病区域在显著图中对应的就是通过本发明所提方法计算得到的显著图中的显著区域,本发明通过显著性强弱的竞争产生几个显著区域,比较常用的竞争机制是胜者为王(Winner‑take‑all)竞争机制,即显著图中的几个显著区域进行比较,显著值比较大、显著性比较强的区域首先获得人眼的注意,一旦注意目标确定以后,场景中的其他部分将不会再获得注意,禁止返回机制(Inhibition of Return)是显著区域转移中的另一个重要的机制,在寻找显著区域的过程中,注意过的显著区域将不再参与显著区域的转移过程,即每个显著区域只有一次被注意的机会,通过胜者为王和禁止返回机制得到纸病区域。
地址 250000 山东省济南市南辛庄西路336号