发明名称 一种基于熵值的运动目标检测方法
摘要 本发明公开一种基于熵值的运动目标检测方法,其首先读入场景图像数据,并进行灰度化处理,然后标定场景中的监控区域,对各监控区域相邻两帧灰度图像做差分运算,基于差分运算结果的熵值,确定图像分割的最佳阈值,再对分割后的图像进行形态学滤波,继而进行连通区域检测,并对检测到的各连通区域进行标记;最后计算各个连通区域的面积,取面积最大的连通区域标记为运动目标,并输出。本发明综合应用多种图像处理基本方法,将目前计算机视觉、模式识别领域的技术,引入输电线路智能监控领域中,利用输电线路场景中的相关视觉信息实现输电线路场景中大型机械的运动检测,从而预防外力破坏对输电线路造成的影响。
申请公布号 CN103914856A 申请公布日期 2014.07.09
申请号 CN201410147852.3 申请日期 2014.04.14
申请人 贵州电网公司输电运行检修分公司 发明人 虢韬;杨恒;徐梁刚
分类号 G06T7/20(2006.01)I;G06T7/00(2006.01)I 主分类号 G06T7/20(2006.01)I
代理机构 南京天翼专利代理有限责任公司 32112 代理人 王玉梅
主权项 一种基于熵值的运动目标检测方法,其特征是,包括以下步骤:(1)读入场景图像数据,对场景图像数据进行灰度化处理:对于一个三分量为R、G、B的彩色图像像素,该点的亮度I按以下公式计算:I=0.3B+0.59G+0.11R    (1)按照公式(1)将彩色的场景图像转换成灰度的场景图像;(2)标定场景中的监控区域,监控区域为覆盖在输电线路周围的1个以上矩形区域:(3)对于已标定的各监控区域,分别对其相邻两帧场景图像的灰度图像,依下式做差分运算:D<sub>k</sub>(x,y)=|f<sub>k+1</sub>(x,y)‑f<sub>k</sub>(x,y)|    (2)式(2)中,f<sub>k+1</sub>(x,y),f<sub>k</sub>(x,y)分别表示第k+1、k帧图像,D<sub>k</sub>(x,y)表示差分运算后的图像;(4)针对上述差分运算结果D<sub>k</sub>(x,y),基于其熵值确定图像分割的最佳阈值:设定一幅M行N列的灰度图像f(x,y),f(x,y)表示图像中坐标(x,y)处的像素点的灰度值,灰度级为L(1<L≤256),其中f(x,y)的取值范围为[0,L‑1],即:C<sub>L</sub>={0,1,...,L‑1};设f<sub>i</sub>为图像f(x,y)中灰度级i出现的频数,那么i出现的概率为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>P</mi><mi>i</mi></msub><mo>=</mo><mfrac><msub><mi>f</mi><mi>i</mi></msub><mrow><mi>M</mi><mo>&times;</mo><mi>N</mi></mrow></mfrac><mo>,</mo><mi>i</mi><mo>&Element;</mo><msub><mi>C</mi><mi>L</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000011.GIF" wi="1659" he="130" /></maths>假设存在阈值t将图像分割为前景O和背景B,前景O:{f(x,y)≤t},背景B:{t<f(x,y)<L},归一化变换得到前景和背景的分布:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>F</mi><mi>o</mi></msub><mo>=</mo><mo>{</mo><mfrac><msub><mi>p</mi><mn>0</mn></msub><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mfrac><msub><mi>p</mi><mn>1</mn></msub><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mfrac><msub><mi>p</mi><mi>t</mi></msub><mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000012.GIF" wi="1669" he="127" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>F</mi><mi>B</mi></msub><mo>=</mo><mo>{</mo><mfrac><msub><mi>p</mi><mrow><mi>t</mi><mo>+</mo><mn>1</mn></mrow></msub><mrow><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mfrac><msub><mi>p</mi><mrow><mi>t</mi><mo>+</mo><mn>2</mn></mrow></msub><mrow><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>&CenterDot;</mo><mo>,</mo><mfrac><msub><mi>p</mi><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></msub><mrow><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow></mrow></mfrac><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000013.GIF" wi="1664" he="127" /></maths>其中<img file="FDA0000490642240000014.GIF" wi="286" he="138" />表示灰度级0到t‑1的概率之和;根据图像熵的定义:<img file="FDA0000490642240000015.GIF" wi="411" he="116" />得到前景O和背景B的熵分别为:<maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>E</mi><mi>o</mi></msub><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>t</mi></munderover><mo>[</mo><msub><mi>p</mi><mi>i</mi></msub><mo>/</mo><mi>p</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>]</mo><mo>&times;</mo><mi>ln</mi><mo>[</mo><msub><mi>p</mi><mi>i</mi></msub><mo>/</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>]</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000016.GIF" wi="1680" he="138" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>E</mi><mi>B</mi></msub><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>/</mo><mo>[</mo><mn>1</mn><mo>-</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>]</mo><mo>}</mo><mo>&times;</mo><mi>ln</mi><mo>{</mo><msub><mi>p</mi><mi>i</mi></msub><mo>/</mo><mn>1</mn><mo>-</mo><mo>[</mo><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>]</mo><mo>}</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000021.GIF" wi="1675" he="174" /></maths>两部分信息熵之和为:E=E<sub>o</sub>+E<sub>B</sub>=ln{P(t)×[1‑P(t)}‑H(t)/P(t)‑H'(t)/[1‑P(t)]    (8)其中:<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><mi>P</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>t</mi></munderover><msub><mi>p</mi><mi>i</mi></msub><mo>,</mo><mi>H</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>t</mi></munderover><msub><mi>p</mi><mi>i</mi></msub><mi>ln</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000022.GIF" wi="690" he="129" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msup><mi>H</mi><mo>&prime;</mo></msup><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>L</mi><mo>-</mo><mn>1</mn></mrow></munderover><msub><mi>p</mi><mi>i</mi></msub><mi>ln</mi><mrow><mo>(</mo><msub><mi>p</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000023.GIF" wi="446" he="141" /></maths>图像的最佳分割阈值为:<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><mi>Th</mi><mo>=</mo><mi>Arg</mi><munder><mi>max</mi><mrow><mi>t</mi><mo>&Element;</mo><msub><mi>C</mi><mi>L</mi></msub></mrow></munder><mrow><mo>(</mo><mi>E</mi><mo>)</mo></mrow><mo>=</mo><mi>Arg</mi><munder><mi>max</mi><mrow><mi>t</mi><mo>&Element;</mo><msub><mi>C</mi><mi>L</mi></msub></mrow></munder><mrow><mo>(</mo><msub><mi>E</mi><mi>O</mi></msub><mo>+</mo><msub><mi>E</mi><mi>B</mi></msub><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000490642240000024.GIF" wi="1665" he="98" /></maths>即求灰度级i使得式(9)最大,那么该灰度级即为图像分割的最佳阈值;(5)对经上述最佳阈值进行分割后的图像进行形态学滤波,利用开运算消除图像噪声,利用闭运算填补图像空洞;(6)对形态学滤波后的图像进行连通区域检测,并对检测到的各连通区域进行标记;(7)计算步骤(6)中检测到的各个连通区域的面积,取面积最大的连通区域标记为运动目标;(8)输出运动目标。
地址 550002 贵州省贵阳市粑粑街5号