发明名称 一种电子变调音频的鉴定方法
摘要 本发明公开了一种电子变调音频的鉴定方法,是根据电子变调的特点而提出的判别方法,属于多媒体信息安全领域。本发明方法包括以下步骤:(1)提取音频特征;(2)构造分类器模型;(3)按照步骤(1)提取待测音频片段的特征,利用步骤(2)得到的分类器模型进行检测判断。本发明方法能鉴定一段待测音频是原始音频还是电子变调音频,并且对不同的变调方法有很稳健的鲁棒性,从而可以为司法取证提供帮助。
申请公布号 CN103440868A 申请公布日期 2013.12.11
申请号 CN201310345919.X 申请日期 2013.08.09
申请人 中山大学 发明人 吴浩君;王泳;黄继武
分类号 G10L21/003(2013.01)I 主分类号 G10L21/003(2013.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 林丽明
主权项 一种电子变调音频的鉴定方法,其特征在于,包括:S1.构造分类器模型,具体为:建立训练音频库,其中包括原始音频集和电子变调音频集,根据不同的变调系数,将电子变调音频集划分为K个电子变调音频子集;分别提取原始音频集的音频特征集和K个电子变调音频子集的音频特征集;将原始音频集的特征集分别和K个电子变调音频子集的特征集合在一起,输入到分类器中,分别训练得到K个分类器模型;S2.利用分类器模型对待测音频片段做检测判断,具体:提取待测音频片段的特征;将待测音频片段的特征输入到K个分类器中,分别获得K个鉴定结果;如果K个鉴定结果都是原始音频,则待测音频片段被鉴定为原始音频;如果其中有一个鉴定结果是电子变调音频,则待测音频片段被鉴定为电子变调音频;其中上述音频特征提取的具体方式为:1)对音频进行语音检测,截掉音频的静音部分;2)对音频的幅值进行归一化,使其分布在区间[‑1,1]内;3)对音频进行加窗、分帧,分帧后音频的帧数记作N;4)提取每一帧音频的d阶梅尔频率倒谱系数MFCC,记作M1,M2,…, MN;5)对M1,M2,…,MN做帧间一阶差分和帧间二阶差分,得到每一帧音频的MFCC一阶差分和二阶差分系数,记作△M1,△M2,…,△MN和△△M1,△△M2,…,△△MN,基于第i帧音频提取的MFCC及其差分系数矢量,记作Vi,i = {1,2,…,N},Vi有D = 3d 个分量,Vi的第j分量记作 vij,所有N个第j分量的集合,记作Xj = { v1j, v2j,…,vNj }, j = {1,2,…,D};6)计算每一个分量集合Xj的均值mj,j={1,2,…,D},以及不同的分量集合Xj和Xj’之间的相关系数cjj’、j、j’ = {1, 2,…,D}, j ≠ j’;7)将所得的均值和相关系数组合起来,作为音频特征f, f = [m1,m2,…, mD,c12,c13,…,cD‑1D]。
地址 510275 广东省广州市新港西路135号中山大学