主权项 |
1.一种基于音视频融合策略的敏感视频检测方法,其特征在于,包括步骤:通过敏感声音模型建立模块,建立敏感声音的混合高斯模型;通过音视频分离模块,实现音视频数据的分离和加窗;通过特征提取模块,实现音频特征提取;通过分类融合模块,实现敏感声音片段的定位及敏感程度输出;通过分类融合模块,实现敏感片断视频图像帧的检测,通过分类融合模块,基于贝叶斯的音视频融合决策,将音频检测结果和视频检测结果相融合,对影片的敏感性做出综合决策;所述音视频融合决策的融合算法由基于贝叶斯规则确定:F=[N<sub>1</sub>log(1-p<sub>2</sub>)+N<sub>2</sub>log(p<sub>2</sub>)+log(L<sub>t</sub>)] -[N<sub>1</sub>log(p<sub>1</sub>)+N<sub>2</sub>log(1-p<sub>1</sub>)+log(1-L<sub>t</sub>+ε)],式中,统计敏感视频图像帧识别算法的两类分类错误概率:把一幅正常图像误分为敏感图像的概率为p1,把一幅敏感图像误分为正常图像的概率为p2,假定被分割出的视频片断共有N幅关键帧,假定敏感图像检测算法对这N幅关键帧图像的识别结果为:N1幅关键帧图像是敏感的,N2幅关键帧图像是正常的;L<sub>t</sub>是音频片段的敏感程度;ε是一个足够小的正数;若因子F≥0,则影片被认为是敏感的;所述的敏感声音片段的定位及其敏感程度输出包括:计算声音片段与训练得到的混合高斯模型各高斯中心的马氏距离,并求其最小值dm;按照如下公式,计算音频片段的敏感程度:<img file="FSB00000384938100011.GIF" wi="520" he="249" />其中,θd是一个阈值,当dm<θd时,该声音片断被认为是敏感声音,否则为非敏感声音。 |