发明名称 基于视频像素时空相关性的通用视频隐写分析方法
摘要 本发明公开了一种基于视频像素时空相关性的通用视频隐写分析方法,该方法包括:对训练集中的视频进行解压并提取多个图像分段,对每一图像分段进行切片获得多个切片图像;对每个切片图像进行差分滤波和阈值化处理;在每个切片图像的所有差分图像中任选两个或多个,利用像素邻域关系的描述得到与切片图像对应的多个联合概率分布矩阵,将每个矩阵的元素合并成一维向量作为特征向量;对特征向量进行类别标记后输入到分类器中得到分类器模型;按照上述步骤提取待分析视频的特征向量,并输入到分类器模型进行分类,得到隐写分析结果。本发明充分利用了视频的时域相关性,提高了隐写分析效果,且可应用于多种不同类型视频隐写算法的分析系统中。
申请公布号 CN103281473B 申请公布日期 2015.04.15
申请号 CN201310231271.3 申请日期 2013.06.09
申请人 中国科学院自动化研究所 发明人 谭铁牛;董晶;许锡锴
分类号 H04N1/32(2006.01)I;G06T1/00(2006.01)I 主分类号 H04N1/32(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种基于视频像素时空相关性的通用视频隐写分析方法,其特征在于,该方法包括以下步骤:步骤S1,对于训练集中的每个视频进行解压,并按照固定长度提取多个图像分段,对于每一图像分段进行切片获得与每一图像分段对应的多个切片图像;步骤S2,对所述步骤S1中得到的每个切片图像分别使用多个不同的模板进行差分滤波,得到相应的多个差分图像;步骤S3,对所述步骤S2中得到的多个差分图像,使用预定阈值T进行阈值化处理得到多个新的差分图像;步骤S4,在所述步骤S3中得到的对应每个切片图像的所有差分图像中任意挑选两个或多个,对于组成的每个差分图像对或差分图像组,利用像素邻域关系的描述,即计算对应位置像素点的联合概率分布,得到对应每个差分图像对或差分图像组的联合概率分布矩阵,进而得到对应多个切片图像的多个联合概率分布矩阵,将每个矩阵的元素合并成一维向量作为用于隐写分析的特征向量;步骤S5,对所述步骤S4得到的多个特征向量进行类别信息的标记,并将标记好类别信息的所有特征向量输入到分类器中进行训练,得到分类器模型,其中,所述类别信息包括隐写视频或未隐写视频;步骤S6:对待分析视频按照与所述步骤S1‑4类似的步骤提取得到其用于隐写分析的特征向量;步骤S7:将所述待分析视频的特征向量输入到所述步骤S5中得到的分类器模型进行分类,得到每一图像分段的类别信息后,融合所有图像分段的类别信息输出整段视频的类别信息,得到所述待分析视频是否为隐写视频的分析结果;其中:在所述步骤S1中获得与每一图像分段对应的多个切片图像时,把提取得到的每一图像分段看成一个三维信号,即立方体;然后按照视频帧的每一行对所述立方体进行切片操作,得到和行数数量相同的行切片,再按照视频帧的每一列对所述立方体进行切片操作,得到和列数数量相同的列切片,所述行切片和列切片组成了所述多个切片图像;所述差分滤波为将所述切片图像与差分滤波器模板进行卷积运算,得到差分图像D<sub>k</sub>:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>D</mi><mi>k</mi></msub><mo>=</mo><msub><mi>h</mi><mi>k</mi></msub><mo>&CircleTimes;</mo><mi>Y</mi><mo>,</mo></mrow>]]></math><img file="FDA00006639388300000211.GIF" wi="359" he="94" /></maths>其中,h<sub>k</sub>为差分滤波器模板,所述差分滤波器模板h<sub>k</sub>包括8个各种尺度、各个差分方向的模板,分别表示为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><msub><mi>h</mi><mn>1</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000021.GIF" wi="349" he="235" /></maths><maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><msub><mi>h</mi><mn>2</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000022.GIF" wi="349" he="236" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><msub><mi>h</mi><mn>3</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000023.GIF" wi="350" he="234" /></maths><maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>h</mi><mn>4</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>1</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000663938830000024.GIF" wi="382" he="235" /></maths><maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msub><mi>h</mi><mn>5</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000025.GIF" wi="350" he="234" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msub><mi>h</mi><mn>6</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000026.GIF" wi="349" he="234" /></maths><maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msub><mi>h</mi><mn>7</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced></mrow>]]></math><img file="FDA0000663938830000027.GIF" wi="350" he="233" /></maths><maths num="0009" id="cmaths0009"><math><![CDATA[<mrow><msub><mi>h</mi><mn>8</mn></msub><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><mo>-</mo><mn>1</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr></mtable></mfenced><mo>;</mo></mrow>]]></math><img file="FDA0000663938830000028.GIF" wi="385" he="252" /></maths>所述步骤S3中的阈值化处理为:所述差分图像中大于T的数值用T代替,小于‑T的数值用‑T代替:<maths num="0010" id="cmaths0010"><math><![CDATA[<mrow><mi>D</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='{' close=''><mtable><mtr><mtd><mi>D</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow></mtd><mtd><mo>-</mo><mi>T</mi><mo>&lt;</mo><mi>D</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&lt;</mo><mi>T</mi></mtd></mtr><mtr><mtd><mi>T</mi></mtd><mtd><mi>D</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&GreaterEqual;</mo><mi>T</mi></mtd></mtr><mtr><mtd><mo>-</mo><mi>T</mi></mtd><mtd><mi>D</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>&le;</mo><mo>-</mo><mi>T</mi></mtd></mtr></mtable></mfenced><mo>,</mo></mrow>]]></math><img file="FDA0000663938830000029.GIF" wi="773" he="233" /></maths>其中,D(i,j)表示差分图像;在所述步骤S7中融合所有图像分段的类别信息时,设定一阈值,当所述待分析视频中的属于隐写类别的图像分段的比例大于此阈值时,即判定该视频为隐写视频。
地址 100190 北京市海淀区中关村东路95号