发明名称 基于RGB分量分布的视频图像背景检测方法
摘要 本发明提供了一种基于RGB分量分布的视频图像背景检测方法,该方法通过对视频图像像素点的RGB分量分布特征加以考虑和分析,根据研究、分析发现的视频图像中像素点的RGB分量分布特性,利用像素点RGB均值矩阵作为其RGB分量分布中心进行坐标转换对视频图像像素点的RGB分量分布特征进行度量,获取视频图像中背景像素点真实的橄榄球形RGB分量分布轮廓,并结合阈值法进行背景检测,提高了背景检测准确性,并同时保证了该方法具备良好的实时性和鲁棒性;即便其背景检测结果中存在少量噪点,也都主要分布在前景像素点的附近,完全能够满足实际应用中视频图像背景识别和前景捕获的实用准确性要求。
申请公布号 CN102510437A 申请公布日期 2012.06.20
申请号 CN201110327813.8 申请日期 2011.10.25
申请人 重庆大学 发明人 洪明坚;徐玲;张小洪;杨梦宁;杨丹;霍东海;葛永新;陈远;胡海波
分类号 H04N5/14(2006.01)I;G06K9/62(2006.01)I 主分类号 H04N5/14(2006.01)I
代理机构 重庆博凯知识产权代理有限公司 50212 代理人 张先芸
主权项 1.基于RGB分量分布的视频图像背景检测方法,其特征在于,包括如下步骤:a)从视频中提取F帧背景图像作为训练样本集,80≤F≤L,L表示视频的总帧数;b)分别求取训练样本集中图像各像素点的RGB均值矩阵:<maths num="0001"><![CDATA[<math><mrow><msub><mover><mi>X</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>=</mo><mfrac><mn>1</mn><mi>F</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>F</mi></munderover><msub><mi>X</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>,</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mrow><mo>(</mo><mi>M</mi><mo>&times;</mo><mi>N</mi><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>其中,k表示训练样本集的图像中像素点的序号,M×N表示视频图像的分辨率;<img file="FDA0000102063930000012.GIF" wi="55" he="57" />表示训练样本集中图像第k个像素点的RGB均值矩阵;X<sub>k</sub>(i)=[R<sub>k</sub>(i),G<sub>k</sub>(i),B<sub>k</sub>(i)]表示训练样本集中第i帧图像第k个像素点的RGB矩阵,1≤i≤F,R<sub>k</sub>(i)、G<sub>k</sub>(i)和B<sub>k</sub>(i)分别表示训练样本集中第i帧图像第k个像素点的红色分量值、绿色分量值和蓝色分量值;c)分别求取训练样本集中图像各像素点的RGB协方差矩阵:<maths num="0002"><![CDATA[<math><mrow><mi>cov</mi><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mi>F</mi><mo>-</mo><mn>1</mn></mrow></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>F</mi></munderover><mo>[</mo><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><msub><mover><mi>X</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>)</mo></mrow><mo>&times;</mo><msup><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow><mo>-</mo><msub><mover><mi>X</mi><mo>&OverBar;</mo></mover><mi>k</mi></msub><mo>)</mo></mrow><mi>T</mi></msup><mo>]</mo><mo>,</mo><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><mrow><mo>(</mo><mi>M</mi><mo>&times;</mo><mi>N</mi><mo>)</mo></mrow><mo>;</mo></mrow></math>]]></maths>其中,cov(X<sub>k</sub>)表示训练样本集中图像第k个像素点的RGB协方差矩阵;T为矩阵转置符号;进而分别求得训练样本集中图像各像素点RGB协方差矩阵的特征值和特征向量;其中,训练样本集中图像第k个像素点RGB协方差矩阵的三个特征值分别为γ<sub>1</sub>(X<sub>k</sub>),γ<sub>2</sub>(X<sub>k</sub>),γ<sub>3</sub>(X<sub>k</sub>),且有γ<sub>1</sub>(X<sub>k</sub>)>γ<sub>2</sub>(X<sub>k</sub>)>γ<sub>3</sub>(X<sub>k</sub>),所述三个特征值γ<sub>1</sub>(X<sub>k</sub>),γ<sub>2</sub>(X<sub>k</sub>),γ<sub>3</sub>(X<sub>k</sub>)对应的三个特征向量分别为u<sub>1</sub>(X<sub>k</sub>),u<sub>2</sub>(X<sub>k</sub>),u<sub>3</sub>(X<sub>k</sub>);d)根据训练样本集中图像各像素点RGB协方差矩阵的特征值分别确定视频图像每个像素点对应的三个背景边界阈值:<maths num="0003"><![CDATA[<math><mrow><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>1</mn></mrow></msub><mo>=</mo><mi>n</mi><mo>&times;</mo><msqrt><msub><mi>&gamma;</mi><mn>1</mn></msub><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mo>)</mo></mrow></msqrt><mo>,</mo></mrow></math>]]></maths><maths num="0004"><![CDATA[<math><mrow><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>2</mn></mrow></msub><mo>=</mo><mi>n</mi><mo>&times;</mo><msqrt><msub><mi>&gamma;</mi><mn>2</mn></msub><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mo>)</mo></mrow></msqrt><mo>,</mo></mrow></math>]]></maths><maths num="0005"><![CDATA[<math><mrow><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>3</mn></mrow></msub><mo>=</mo><mi>n</mi><mo>&times;</mo><msqrt><msub><mi>&gamma;</mi><mn>3</mn></msub><mrow><mo>(</mo><msub><mi>X</mi><mi>k</mi></msub><mo>)</mo></mrow></msqrt><mo>;</mo></mrow></math>]]></maths>k=1,2,…,(M×N);其中,TH<sub>k,1</sub>、TH<sub>k,2</sub>、TH<sub>k,3</sub>分别表示视频图像第k个像素点对应的三个背景边界阈值;参数n为常数,取值范围为1~5;e)对于视频中作为背景检测对象的J帧图像,1≤J≤L,根据训练样本集中图像各像素点RGB协方差矩阵的特征向量分别确定取作为背景检测对象的每一帧图像中每一个像素点对应的三个分量转换特征值:<maths num="0006"><![CDATA[<math><mrow><msubsup><mi>X</mi><mi>k</mi><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>1</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>2</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mn>0</mn></mtd><mtd><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>3</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>=</mo><msup><msub><mi>U</mi><mi>k</mi></msub><mi>T</mi></msup><mo>&times;</mo><msub><mi>X</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>u</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>u</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><msub><mi>u</mi><mn>3</mn></msub></mtd></mtr></mtable></mfenced><mo>&times;</mo><mfenced open='[' close=']'><mtable><mtr><mtd><msub><mi>R</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>G</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>B</mi><mi>k</mi></msub><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow></mtd></mtr></mtable></mfenced><mo>;</mo></mrow></math>]]></maths>k=1,2,…,(M×N);其中,<img file="FDA0000102063930000022.GIF" wi="154" he="50" />表示作为背景检测对象的第j帧图像第k个像素点的分量转换矩阵;<img file="FDA0000102063930000023.GIF" wi="542" he="55" />分别表示作为背景检测对象的第j帧图像第k个像素点对应的三个分量转换特征值;X<sub>k</sub>(j)=[R<sub>k</sub>(j),G<sub>k</sub>(j),B<sub>k</sub>(j)]表示作为背景检测对象的第j帧图像第k个像素点的RGB矩阵,R<sub>k</sub>(j)、G<sub>k</sub>(j)和B<sub>k</sub>(j)分别表示作为背景检测对象的第j帧图像第k个像素点的红色分量值、绿色分量值和蓝色分量值;U<sub>k</sub>=[u<sub>1</sub>(X<sub>k</sub>),u<sub>2</sub>(X<sub>k</sub>),u<sub>3</sub>(X<sub>k</sub>)]表示由训练样本集中图像第k个像素点RGB协方差矩阵的三个特征向量u<sub>1</sub>(X<sub>k</sub>),u<sub>2</sub>(X<sub>k</sub>),u<sub>3</sub>(X<sub>k</sub>)构成的特征向量矩阵;T为矩阵转置符号;f)对于视频中作为背景检测对象的J帧图像,若同时满足:<maths num="0007"><![CDATA[<math><mrow><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>1</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>&le;</mo><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>1</mn></mrow></msub><mo>,</mo></mrow></math>]]></maths><maths num="0008"><![CDATA[<math><mrow><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>2</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>&le;</mo><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>2</mn></mrow></msub><mo>,</mo></mrow></math>]]></maths>且<maths num="0009"><![CDATA[<math><mrow><msubsup><mi>x</mi><mrow><mi>k</mi><mo>,</mo><mn>3</mn></mrow><mi>pro</mi></msubsup><mrow><mo>(</mo><mi>j</mi><mo>)</mo></mrow><mo>&le;</mo><msub><mi>TH</mi><mrow><mi>k</mi><mo>,</mo><mn>3</mn></mrow></msub><mo>;</mo></mrow></math>]]></maths>则判定作为背景检测对象的第j帧图像第k个像素点为背景像素点;否则,判定作为背景检测对象的第j帧图像第k个像素点为前景像素点;由此检测出视频中作为背景检测对象的J帧图像的各个像素点是否为背景像素点,完成对作为背景检测对象的J帧图像的背景检测。
地址 400044 重庆市沙坪坝区沙正街174号