发明名称 基于音视频融合策略的敏感影片检测方法
摘要 本发明是一种基于音视频融合策略的敏感视频检测方法,包括步骤:建立敏感声音的混合高斯模型,音频数据的分离、加窗、以及特征提取,敏感声音片段的定位及其敏感程度输出,敏感片断视频图像帧的检测,基于贝叶斯的音视频融合决策等。本发明结合了音频和视频两个模态的信息来过滤敏感视频,大大降低了采用单一模态可能出现的不确定性,显著提高了识别效率。本发明可以用来检测互联网上的视频流以及音像制品中是否包含敏感内容,亦可以用来对网络视频聊天室进行监控,一旦发现色情表演即进行阻断。
申请公布号 CN101470897B 申请公布日期 2011.04.20
申请号 CN200710304206.3 申请日期 2007.12.26
申请人 中国科学院自动化研究所 发明人 胡卫明;左海强;吴偶
分类号 G06T7/00(2006.01)I 主分类号 G06T7/00(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 周国城
主权项 1.一种基于音视频融合策略的敏感视频检测方法,其特征在于,包括步骤:通过敏感声音模型建立模块,建立敏感声音的混合高斯模型;通过音视频分离模块,实现音视频数据的分离和加窗;通过特征提取模块,实现音频特征提取;通过分类融合模块,实现敏感声音片段的定位及敏感程度输出;通过分类融合模块,实现敏感片断视频图像帧的检测,通过分类融合模块,基于贝叶斯的音视频融合决策,将音频检测结果和视频检测结果相融合,对影片的敏感性做出综合决策;所述音视频融合决策的融合算法由基于贝叶斯规则确定:F=[N<sub>1</sub>log(1-p<sub>2</sub>)+N<sub>2</sub>log(p<sub>2</sub>)+log(L<sub>t</sub>)]   -[N<sub>1</sub>log(p<sub>1</sub>)+N<sub>2</sub>log(1-p<sub>1</sub>)+log(1-L<sub>t</sub>+ε)],式中,统计敏感视频图像帧识别算法的两类分类错误概率:把一幅正常图像误分为敏感图像的概率为p1,把一幅敏感图像误分为正常图像的概率为p2,假定被分割出的视频片断共有N幅关键帧,假定敏感图像检测算法对这N幅关键帧图像的识别结果为:N1幅关键帧图像是敏感的,N2幅关键帧图像是正常的;L<sub>t</sub>是音频片段的敏感程度;ε是一个足够小的正数;若因子F≥0,则影片被认为是敏感的;所述的敏感声音片段的定位及其敏感程度输出包括:计算声音片段与训练得到的混合高斯模型各高斯中心的马氏距离,并求其最小值dm;按照如下公式,计算音频片段的敏感程度:<img file="FSB00000384938100011.GIF" wi="520" he="249" />其中,θd是一个阈值,当dm<θd时,该声音片断被认为是敏感声音,否则为非敏感声音。
地址 100080 北京市海淀区中关村东路95号