发明名称 一种基于显著区域的视频指纹提取方法
摘要 本发明公开了一种基于显著区域的视频指纹提取方法,首先对视频每帧作改进的FT(Frequency‑Tuned)显著性检测,形成显著图,然后基于显著图的显著区域提取空时域三维联合的改进WLD(Weber Local Descriptor)特征形成视频指纹;在具体操作中,本发明仅在显著区域提取视频指纹,这样就将基于全幅图像的指纹提取转化为基于局部关键信息区域的指纹提取,大大降低了视频指纹提取的运算量,提高了效率。
申请公布号 CN106021610A 申请公布日期 2016.10.12
申请号 CN201610485292.1 申请日期 2016.06.28
申请人 电子科技大学 发明人 徐杰;谢艾芸;何庆强
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 成都行之专利代理事务所(普通合伙) 51220 代理人 温利平
主权项 一种基于显著区域的视频指纹提取方法,其特征在于,包括以下步骤:(1)、基于边界背景先验的FT算法确定出某一帧图像的4个边界区域,并标记为伪背景区域L<sub>top</sub>、L<sub>bottom</sub>、L<sub>left</sub>、L<sub>right</sub>;(2)、利用图像的灰度级统计,计算出4个伪背景区的复杂度,选取复杂度最低的伪背景区域设置为背景区域;(3)、根据背景区域设置以像素点p(x,y)为中心的对称子区域A,其中,x<sub>0</sub>为对称子区域A的宽度,y<sub>0</sub>为对称子区域A的高度;以该帧图像的左上角像素点为坐标原点,以垂直向下的方向为X轴,以水平向右的方向为Y轴,建立二维直角坐标系,则有:<img file="FDA0001032379170000011.GIF" wi="998" he="261" /><img file="FDA0001032379170000012.GIF" wi="958" he="246" />其中,w表示该帧图像的宽度,h表示该帧图像的高度;(4)、求取图像中任意像素素点p(x,y)的显著值S(x,y);S(x,y)=||I<sub>μ</sub>(x,y)‑I<sub>g</sub>(x,y)||其中,I<sub>g</sub>(x,y)是像素点p(x,y)的3×3的高斯核函数滤波值;I<sub>μ</sub>(x,y)是以像素点p(x,y)为中心的环绕对称子区域A在CIELAB颜色集下三通道的各自的平均值,具体计算公式为:<maths num="0001"><math><![CDATA[<mrow><msub><mi>I</mi><mi>&mu;</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mfrac><mn>1</mn><mi>N</mi></mfrac><munder><mo>&Sigma;</mo><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo><mo>&Element;</mo><mi>A</mi></mrow></munder><mi>l</mi><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mtd></mtr><mtr><mtd><mfrac><mn>1</mn><mi>N</mi></mfrac><munder><mo>&Sigma;</mo><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo><mo>&Element;</mo><mi>A</mi></mrow></munder><mi>a</mi><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mtd></mtr><mtr><mtd><mfrac><mn>1</mn><mi>N</mi></mfrac><munder><mo>&Sigma;</mo><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo><mo>&Element;</mo><mi>A</mi></mrow></munder><mi>b</mi><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>)</mo></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001032379170000013.GIF" wi="603" he="479" /></maths>其中,N表示称子区域A包含像素点的总数目,l(i,j)、a(i,j)、b(i,j)分别表示对称子区域A中坐标为(x,y)的像素值在CIELAB颜色集下l通道、a通道、b通道下的值;当所有像素点按照步骤(4)处理后,形成显著图;(5)、在显著区域上计算T‑WLD的差分激励在显著图上依次对每个像素点的显著值进行判断,将显著值超过预设阈值的所有像素点形成显著区域;对显著区域上的像素点进行差分激励计算:以显著区域中的像素点(x,y)为中心,设置3×3的正方形领域,再对正方形领域施加滤波窗函数f<sub>00</sub>和f<sub>01</sub>,分别得到<img file="FDA0001032379170000021.GIF" wi="61" he="71" />与<img file="FDA0001032379170000022.GIF" wi="91" he="70" /><maths num="0002"><math><![CDATA[<mrow><msubsup><mi>v</mi><mi>s</mi><mn>00</mn></msubsup><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mn>7</mn></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>k</mi></msub><mo>-</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001032379170000023.GIF" wi="349" he="126" /></maths><maths num="0003"><math><![CDATA[<mrow><msubsup><mi>v</mi><mi>s</mi><mn>01</mn></msubsup><mo>=</mo><msub><mi>x</mi><mi>c</mi></msub></mrow>]]></math><img file="FDA0001032379170000024.GIF" wi="156" he="65" /></maths>其中,x<sub>c</sub>表示正方形领域中中心像素点的灰度值,x<sub>k</sub>表示正方形领域中除中心像素点外其余像素点的灰度值;根据韦伯定律,求出韦伯分数;<maths num="0004"><math><![CDATA[<mrow><msub><mi>G</mi><mrow><mi>r</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><msubsup><mi>v</mi><mi>s</mi><mn>00</mn></msubsup><msubsup><mi>v</mi><mi>s</mi><mn>01</mn></msubsup></mfrac></mrow>]]></math><img file="FDA0001032379170000025.GIF" wi="318" he="134" /></maths>对韦伯分数经过反正切函数滤波,得到最终的差分激励;<maths num="0005"><math><![CDATA[<mrow><mi>&xi;</mi><mrow><mo>(</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>=</mo><msub><mi>f</mi><mi>arctan</mi></msub><mo>&lsqb;</mo><msub><mi>G</mi><mrow><mi>r</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo><mo>=</mo><mi>arctan</mi><mo>&lsqb;</mo><msub><mi>G</mi><mrow><mi>r</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi></mrow></msub><mrow><mo>(</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo><mo>=</mo><mi>arctan</mi><mo>&lsqb;</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>0</mn></mrow><mn>7</mn></munderover><mrow><mo>(</mo><msub><mi>x</mi><mi>k</mi></msub><mo>-</mo><msub><mi>x</mi><mi>c</mi></msub><mo>)</mo></mrow><mo>&rsqb;</mo></mrow>]]></math><img file="FDA0001032379170000026.GIF" wi="1398" he="140" /></maths>(6)、对显著区域上的像素点计算T‑WLD的方向以该帧图像的左上角像素为坐标原点,以垂直向下的方向为X轴,以水平向右的方向为Y轴,以视频帧排列方向为T轴,建立一个三维直角坐标系;对于显著区域中的任意像素点(x,y,i),计算方向θ<sub>three</sub>:<maths num="0006"><math><![CDATA[<mrow><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>=</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>+</mo><mn>1</mn><mo>,</mo><mi>y</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001032379170000027.GIF" wi="635" he="71" /></maths><maths num="0007"><math><![CDATA[<mrow><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>=</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>+</mo><mn>1</mn><mo>,</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><mi>p</mi><mrow><mo>(</mo><mi>x</mi><mo>,</mo><mi>y</mi><mo>-</mo><mn>1</mn><mo>,</mo><mi>i</mi><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001032379170000028.GIF" wi="638" he="63" /></maths>v<sub>t</sub>=p(x,y,i+1)‑p(x,y,i‑1)<maths num="0008"><math><![CDATA[<mrow><msub><mi>k</mi><mi>a</mi></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>v</mi><mi>t</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>]]></math><img file="FDA0001032379170000029.GIF" wi="431" he="102" /></maths><maths num="0009"><math><![CDATA[<mrow><msub><mi>k</mi><mi>b</mi></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msub><mi>v</mi><mi>t</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>]]></math><img file="FDA0001032379170000031.GIF" wi="428" he="103" /></maths><maths num="0010"><math><![CDATA[<mrow><msub><mi>k</mi><mi>c</mi></msub><mo>=</mo><msqrt><mrow><msup><mrow><mo>(</mo><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>)</mo></mrow><mn>2</mn></msup></mrow></msqrt></mrow>]]></math><img file="FDA0001032379170000032.GIF" wi="451" he="102" /></maths><maths num="0011"><math><![CDATA[<mrow><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>=</mo><mfrac><mrow><msup><msub><mi>k</mi><mi>a</mi></msub><mn>2</mn></msup><mo>+</mo><msup><msub><mi>k</mi><mi>b</mi></msub><mn>2</mn></msup><mo>-</mo><msup><msub><mi>k</mi><mi>c</mi></msub><mn>2</mn></msup></mrow><mrow><mn>2</mn><mo>&times;</mo><msub><mi>k</mi><mi>a</mi></msub><mo>&times;</mo><msub><mi>k</mi><mi>b</mi></msub></mrow></mfrac></mrow>]]></math><img file="FDA0001032379170000033.GIF" wi="492" he="123" /></maths>将θ<sub>three</sub>映射到(0,2π):<maths num="0012"><math><![CDATA[<mrow><msubsup><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow><mo>&prime;</mo></msubsup><mo>=</mo><mi>arctan</mi><mn>3</mn><mrow><mo>(</mo><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>,</mo></mrow></mtd><mtd><mrow><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>&gt;</mo><mo>=</mo><mn>0</mn><mi>a</mi><mi>n</mi><mi>d</mi><mi> </mi><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>&gt;</mo><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>+</mo><mi>&pi;</mi><mo>/</mo><mn>2</mn><mo>,</mo></mrow></mtd><mtd><mrow><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>&lt;</mo><mo>=</mo><mn>0</mn><mi>a</mi><mi>n</mi><mi>d</mi><mi> </mi><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>&gt;</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>+</mo><mi>&pi;</mi><mo>,</mo></mrow></mtd><mtd><mrow><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>&lt;</mo><mn>0</mn><mi>a</mi><mi>n</mi><mi>d</mi><mi> </mi><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>&lt;</mo><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&theta;</mi><mrow><mi>t</mi><mi>h</mi><mi>r</mi><mi>e</mi><mi>e</mi></mrow></msub><mo>+</mo><mn>2</mn><mi>&pi;</mi><mo>,</mo></mrow></mtd><mtd><mrow><msubsup><mi>v</mi><mi>s</mi><mn>11</mn></msubsup><mo>&gt;</mo><mn>0</mn><mi>a</mi><mi>n</mi><mi>d</mi><mi> </mi><msubsup><mi>v</mi><mi>s</mi><mn>10</mn></msubsup><mo>&lt;</mo><mn>0</mn></mrow></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0001032379170000034.GIF" wi="1118" he="294" /></maths>再将θ′<sub>three</sub>量化到T个离散方向,得到φ<sub>t</sub>:<img file="FDA0001032379170000035.GIF" wi="1358" he="151" />(7)、提取视频指纹将T‑WLD的差分激励和方向组成的一个二维直方图,再将差分激励分别投射在θ′<sub>three</sub>量化得到的T个离散方向上,得到T个一维直方图将φ(t)(t=0,1,2,...,T‑1);再将φ(t)(t=0,1,2,...,T‑1)一维直方图均分成M个小段,每一小段就是一个子直方图H<sub>m,t</sub>,其中t∈(0,1...T‑1),m∈(0,1...M‑1),一共个M×T个子直方图;然后依次遍历所有的t值,得到一个一维直方图H<sub>m</sub>,取遍所有的m就可以得到M个一维直方图H<sub>m</sub>;最后把M个一维直方图H<sub>m</sub>(m=0,1...,M‑1)依次串联,就得到该帧的视频指纹H={H<sub>m</sub>}(m=0,1,2,...,M‑1);同理,按照上述方法继续处理视频的其它帧,当所有帧处理完成后,将每一帧得到的指纹进行串联,得到最终提取的视频指纹。
地址 611731 四川省成都市高新区(西区)西源大道2006号