发明名称 |
一种音频翻录检测方法 |
摘要 |
本发明公开了一种翻录音频的检测方法,属于信息安全技术领域。将机器学与信号处理方法巧妙结合,使最终学到的音频特征能够区分原始音频和翻录音频。具体为:原始音频在录制过程中记录了当时电网频率的变化情况,音频在回放并翻录的过程中再次记录了当时的电网频率。利用机器学的方法辨别音频中包含一个或两个电网频率信号,从而鉴别原始音频和翻录音频。本发明只需对音频中携带的电网频率成分进行分析,不受语音内容的影响,具有检测准确率高的优点。 |
申请公布号 |
CN105118503A |
申请公布日期 |
2015.12.02 |
申请号 |
CN201510407042.1 |
申请日期 |
2015.07.13 |
申请人 |
中山大学 |
发明人 |
康显桂;林晓丹 |
分类号 |
G10L15/08(2006.01)I;G10L15/04(2013.01)I;G10L15/16(2006.01)I;G10L19/018(2013.01)I |
主分类号 |
G10L15/08(2006.01)I |
代理机构 |
广州粤高专利商标代理有限公司 44102 |
代理人 |
林丽明 |
主权项 |
一种翻录音频检测方法,其特征在于,包括以下步骤:S1.音频预处理,对任意采样率的音频进行降采样,对降采样后的音频信号进行滤波,去除语音内容的干扰,得到音频携带的电网频率基波及谐波分量;该滤波过程是采用电网频率的基波和各次谐波频率为带通中心的窄带滤波;S2.构建训练样本,将上述滤波后的信号进行短时傅里叶变换,得到电网频率信号的时频特征;利用深度学习算法对电网频率信号的时频特征进行更精细的学习,该方法是有监督学习的二分类方法,利用预先标定的正负样本,将正负样本的电网频率信号时频特征作为输入,训练一个多层神经网络模型,正样本为翻录音频,负样本为原始音频;S3.翻录检测:对待检测音频进行分段,将每个分段的时频特征输入训练好的分类器,网络将自动标记出每个分段的类别;若多数分段被标记为正样本,则该音频被判断为翻录音频,否则为原始音频。 |
地址 |
510275 广东省广州市海珠区新港西路135号 |