发明名称 数字音频波形突变的检测方法
摘要 本发明公开了一种音频波形突变的检测方法,根据音频波形突变引起语谱出现脊峰的特点而提出的统计判别方法,属于多媒体信息安全领域。本发明方法针对数字音频由于复制粘贴操作的波形突变检测,分析语谱对数域中音频拼接点前后的脊峰跨度变化,构造脊峰因子描述一帧音频对数语谱的脊峰带宽以表征短时能量变化特点,并利用差分算子区分音频的突然声响与音频波形突变造成的脊峰因子识别。本发明方法包括以下步骤:将音频信号进行短时傅里叶变换,及对数变换,得到对数域的音频语谱;计算语谱中每帧的脊线因子;对脊线因子进行差分变换结果做检测判断。本发明能较有效地对音频波形突变进行识别,为数字音频编辑操作边界的检测提供了一个有效的方法。
申请公布号 CN104021791B 申请公布日期 2017.02.22
申请号 CN201410285152.0 申请日期 2014.06.24
申请人 贵州大学 发明人 徐晶
分类号 G10L19/00(2013.01)I;G10L25/60(2013.01)I 主分类号 G10L19/00(2013.01)I
代理机构 贵阳中新专利商标事务所 52100 代理人 李亮;程新敏
主权项 一种数字音频波形突变的检测方法,其特征在于:包括以下步骤:1)将音频信号变换得到对数域的音频语谱Y,将获得的音频语谱进行对数变换,得到对数语谱G;2)进行对数语谱G能量二值化计算;3)计算每帧对数语谱G<sub>t</sub>的音频突变系数σ<sub>t</sub>;4)对音频突变系数σ<sub>t</sub>进行判断,进行音频波形突变检测和突变区域定位;步骤1)所述的将音频信号变换得到对数域的音频语谱Y,将获得的音频语谱进行对数变换,得到对数语谱G,具体是,对于长度为h的数字音频信号y进行分帧,得到帧数为N<sub>l</sub>,帧长为2*N的矩阵;加入窗函数并进行短时傅里叶变换,得到大小为N*N<sub>1</sub>的音频语谱Y;对音频语谱Y进行对数变换,得到对数语谱G,其大小为N*N<sub>1</sub>;步骤2)所述的进行对数语谱G能量二值化计算,具体是,先计算得到对数语谱G中的最大值G<sub>max</sub>和最小值G<sub>min</sub>,设每帧频率的能量值为G<sub>ti</sub>(1≤t≤N,1≤i≤N<sub>l</sub>),通过如下公式(1)计算能量二值化值δ(t,i),<img file="FDA0001150972920000011.GIF" wi="1491" he="206" />其中λ为阈值因子;步骤3)所述的计算每帧对数语谱G<sub>t</sub>的音频突变系数,具体是,通过公式(2)计算音频突变系数σ<sub>t</sub>(1≤t≤N<sub>1</sub>);<maths num="0001"><math><![CDATA[<mrow><msub><mi>&sigma;</mi><mi>t</mi></msub><mo>=</mo><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>&delta;</mi><mrow><mo>(</mo><mi>t</mi><mo>,</mo><mi>i</mi><mo>)</mo></mrow></mrow><mi>n</mi></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow><mo>;</mo></mrow>]]></math><img file="FDA0001150972920000012.GIF" wi="845" he="223" /></maths>步骤4)所述的对音频突变系数σ<sub>t</sub>进行判断,进行音频波形突变检测和突变区域定位,具体是,假设在步骤3)中得到了对数语谱G第i帧G<sub>i</sub>及相邻帧的三个音频突变系数σ<sub>i‑1</sub>、σ<sub>i</sub>、σ<sub>i+1</sub>,若满足:σ<sub>i</sub>&gt;0.85且|σ<sub>i</sub>‑σ<sub>i‑1</sub>|*|σ<sub>i</sub>‑σ<sub>i+1</sub>|&gt;σ<sub>i</sub>/16则确定音频中存在音频突变,其中第i帧G<sub>i</sub>是检测到的音频波形突变区域。
地址 550025 贵州省贵阳市花溪区贵州大学北校区科学技术处