发明名称 蔬菜病害场景检测方法
摘要 本发明公开了一种蔬菜病害场景检测方法,涉及视频分析与检测技术领域,包括以下步骤:S1:检测压缩视频镜头边界点,并检测声音镜头边界点;S2:检测出声音镜头边界点后,标记声音镜头类型为语音类型或非语音类型;S3:判断声音镜头类型的改变及声音镜头与视频镜头的边界点是否重合得到场景边界检测结果。本发明的蔬菜病害场景检测方法以蔬菜病害场景的语义模型为判断依据,对视频进行场景检测时不仅考虑了镜头的时间连续性,还综合考虑音频镜头与视频镜头的相关性,因此实现了更准确地蔬菜病害场景检测。
申请公布号 CN102752479B 申请公布日期 2014.12.03
申请号 CN201210175727.4 申请日期 2012.05.30
申请人 中国农业大学 发明人 傅泽田;温皓杰;张领先;李鑫星;刘雪;苏叶
分类号 H04N5/14(2006.01)I;H04N7/18(2006.01)I;G06T7/00(2006.01)I 主分类号 H04N5/14(2006.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 王莹
主权项 一种蔬菜病害场景检测方法,其特征在于,包括以下步骤:S1:检测压缩视频镜头边界点,并检测声音镜头边界点;S2:检测出声音镜头边界点后,标记声音镜头类型为语音类型或非语音类型;S3:判断声音镜头类型的改变及声音镜头与视频镜头的边界点是否重合得到场景边界检测结果;所述步骤S1中检测压缩视频镜头边界点具体包括:根据MPEG压缩标准从视频流中提取I帧的离散余弦变换系数;预处理离散余弦变换系数得到I帧的直流系数,根据直流系数建立以直流系数为行、I帧为列的二维表;计算所述二维表中相邻两I帧的直流系数的差异度,若差异度大于预定阈值,则该两帧的分界点作为镜头边界点,将该两I帧划分在不同的镜头,否则将该两I帧归为同一镜头,继续比较下一相邻两I帧,将得到镜头序列用向量S<sub>k</sub>=(s<sub>k</sub>)表示;所述步骤S1中检测声音镜头边界点具体包括:通过预设的响度阈值消除背景声,计算前景声的短时平均能量;根据预设的能量阈值和持续时间阈值检测语音中的停顿,以所述停顿作为所述声音镜头的边界点,从而得到声音镜头序列;所述步骤S2具体包括:计算音频信号的过零率协方差和基本频率能量比;若过零率协方差高于过零率阈值,且基本频率能量比高于能量比阈值,则该段音频信号对应的声音镜头为语音类型;所述步骤S3具体包括:S3.1:检测两相邻声音镜头f<sub>i</sub>与f<sub>i+1</sub>的类型t<sub>i</sub>与t<sub>i+1</sub>是否相同,相同继续,否则进入步骤S3.4;S3.2:检测两相邻声音镜头类型为语音或非语音,当t<sub>i</sub>和t<sub>i+1</sub>为语音时继续,否则进入步骤S3.5;S3.3:检测是否有与声音镜头边界点f<sub>i</sub>重合的视频镜头边界点s<sub>j</sub>,即当声音镜头边界点对应的视频帧同为视频镜头边界点对应的视频帧时继续,否则进入步骤S3.5;S3.4:标记场景边界点fs<sub>i</sub>,fs<sub>i</sub>=f<sub>i</sub>,得到蔬菜病害场景序列,以向量FS<sub>k</sub>=(fs<sub>k</sub>,t<sub>k</sub>)表示;S3.5:i=i+1,转入步骤S3.1检测下一声音镜头,当f<sub>i</sub>=V时,检测结束,输出蔬菜病害场景检测结果,以向量FS<sub>k</sub>=(fs<sub>k</sub>,t<sub>k</sub>)表示,V表示原始视频总长度。
地址 100193 北京市海淀区圆明园西路2号