发明名称 基于渐进二分和自适应阈值的视频镜头边界检测方法
摘要 本发明属于多媒体检索领域,公开了一种基于渐进二分和自适应阈值的视频镜头边界检测方法,包括:步骤一,根据不同视频类型自适应地调整检测单元长度;步骤二,将待检测视频分成长度相等的一组子视频,依次建立帧间差直方图,并由此确定这一子视频的镜头检测阈值;步骤三,对每一个子视频使用步骤二得到的检测阈值进行基于渐进二分策略的视频镜头边界检测。本发明所述的渐进二分策略,能够以对数级地降低计算量;通过在视频渐变镜头变化区间范围内进行二分法检测,解决了视频镜头边界检测中渐变镜头检测难的问题。自适应阈值方法对切变和渐变检测的阈值进行了进一步区分,能够根据视频类型自适应地调整检测单元长度。
申请公布号 CN103310451B 申请公布日期 2016.12.28
申请号 CN201310237875.9 申请日期 2013.06.17
申请人 中国传媒大学 发明人 张鹏洲;霍奕;王艳峰;温宇俊;龚隽鹏;张弛
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 北京思海天达知识产权代理有限公司 11203 代理人 张慧
主权项 一种基于渐进二分和自适应阈值的视频镜头边界检测方法,其特征在于自适应地调整检测单元长度,并采用渐进二分策略进行视频镜头边界检测,包括以下步骤:步骤一,根据不同视频类型自适应地调整检测单元长度,方法如下:(1)采用最大似然估计法,由给定的n个样本视频段求出一整段视频的泊松分布参数λ的估计<img file="FDA0001019298670000011.GIF" wi="122" he="72" />即视频镜头出现速度;n和<img file="FDA0001019298670000012.GIF" wi="96" he="71" />分别由式(1)和式(2)求解:<maths num="0001"><math><![CDATA[<mrow><mi>n</mi><mo>=</mo><mfrac><mrow><mn>20</mn><mi>%</mi><mo>&times;</mo><mi>N</mi></mrow><mi>A</mi></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001019298670000013.GIF" wi="1422" he="118" /></maths><maths num="0002"><math><![CDATA[<mrow><msub><mover><mi>&lambda;</mi><mo>^</mo></mover><mrow><mi>M</mi><mi>L</mi><mi>E</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>k</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001019298670000014.GIF" wi="1438" he="119" /></maths>式中,N为待检测视频帧的总数,A为每个采样视频段的帧数;k<sub>i</sub>为第i个视频段单位视频长度镜头出现的次数;(2)由下式求子视频的长度L:<maths num="0003"><math><![CDATA[<mrow><mi>L</mi><mo>=</mo><mfrac><mi>A</mi><msub><mover><mi>&lambda;</mi><mo>^</mo></mover><mrow><mi>M</mi><mi>L</mi><mi>E</mi></mrow></msub></mfrac><mo>&times;</mo><mi>n</mi><mi>u</mi><mi>m</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0001019298670000015.GIF" wi="1422" he="135" /></maths>式中,num为由实验发现的视频段对应的帧间差直方图,能最好地反映阈值分布特征时视频段中包含镜头边界的个数,1≤num≤8;步骤二,将待检测视频分成长度均为L的一组子视频,然后依次对每一个子视频建立帧间差直方图,通过统计找出其最长的两个零区间[a,b]和[c,d],a&lt;b&lt;c&lt;d,并由此确定这一子视频的镜头检测阈值为T=c;步骤三,对每一个子视频使用步骤二得到的检测阈值c进行基于渐进二分策略的视频镜头边界检测,方法如下:(1)求起始帧和左帧的差异值;若差异值大于阈值,表明左帧位置为镜头分界点,令新的起始帧为左帧,重复本步骤,进入下一轮计算;否则,转下一步;(2)求起始帧和右帧的差异值,如果差异值小于阈值,表明镜头分界点在右帧右侧,令右帧为起始帧,转步骤三的(1),进入下一轮计算;否则,转下一步;(3)差异值大于阈值,表明镜头分界点在右帧左侧,取左帧和右帧包含区间内位于中间位置的帧为中间帧;(4)求起始帧和中间帧的差异值,如果差异值大于阈值,镜头点在中间帧左侧,令中间帧为右帧,若此时右帧与左帧相邻,则右帧为镜头分界点,令新的起始帧为右帧,转步骤三的(1),进入下一轮计算;若不相邻,则再取中间帧,重复本步骤;如果差异值小于阈值,转下一步;(5)差异值小于阈值,表明镜头点在中间帧右侧,令中间帧为左帧,若此时左帧与右帧相邻,则右帧为镜头分界点,令新的起始帧为右帧,转步骤三的(1),进入下一轮计算;若不相邻则再取中间帧,转步骤三的(4);所述起始帧的初值为每一个子视频的首帧,左帧的初值为该子视频的起始帧加3帧后对应的帧,右帧的初值为该子视频的起始帧加30帧后对应的帧;随着渐进二分法的进行,起始帧、左帧和右帧的值如步骤三的(1)、步骤三的(2)、步骤三的(4)、步骤三的(5)的描述动态变化;即中间帧号为左帧号和右帧号之和的一半;在上述检测过程中,如果起始帧超出镜头范围,检测结束。
地址 100024 北京市朝阳区定福庄南里7号