发明名称 |
一种基于频域信息量分布的回放语音检测方法 |
摘要 |
本发明公开了一种基于频域信息量分布的回放语音检测方法,属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布,从而提出了可用于检测回放语音的方法,而通过这种检测方法可有效检测语音是否为回放语音,这种回放语音检测方法能够有效检测来自偷录设备的回放语音,并在回放环境改变情况下,也具备较高的检测准确性;同时,本发明也验证了检测回放语音检测算法具有较好的鲁棒性,采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。 |
申请公布号 |
CN105513598A |
申请公布日期 |
2016.04.20 |
申请号 |
CN201610023352.8 |
申请日期 |
2016.01.14 |
申请人 |
宁波大学 |
发明人 |
王让定;陈亚楠;严迪群;金超;陶表犁;张立 |
分类号 |
G10L17/14(2013.01)I;G10L15/08(2006.01)I |
主分类号 |
G10L17/14(2013.01)I |
代理机构 |
宁波天一专利代理有限公司 33207 |
代理人 |
刘赛云 |
主权项 |
一种基于频域信息量分布的回放语音检测方法,其特征在于该检测方法包括如下步骤:步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待检测语音信号如下操作:(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所述N为256、512、1024;则第i帧短时傅里叶变换为:(N=256/512/1024),并按照公式一进行计算,公式一,<img file="173299dest_path_image001.GIF" wi="240" he="50" />(0≤k≪N‑1)式中:X<sub>i</sub>——傅里叶变换数值;K——傅里叶变换的离散频率参数;n——语段语音信号中每个采样点;(2)按照公式二对第j帧第i个频率点的频率值<img file="463466dest_path_image002.GIF" wi="48" he="42" />(K),求幅值;公式二,<img file="343698dest_path_image003.GIF" wi="295" he="35" />式中:<img file="781632dest_path_image002.GIF" wi="48" he="42" />——第i帧j列的傅里叶变换数值;K——傅里叶变换的离散频率参数;(3)按照公式三对第j点频率求其时间上的平均;公式三,<img file="202249dest_path_image004.GIF" wi="164" he="56" />式中:Yj(k) ——表示第j个频率值在时间上的平均;<img file="612502dest_path_image002.GIF" wi="48" he="42" />——第i帧j列的傅里叶变换数值;(4)按照公式四对总频率点上频率值求和;公式四,<img file="725952dest_path_image005.GIF" wi="183" he="51" />式中:S(k) ——表示各频率值之和;Yj(k) ——表示第j个频率值在时间上的平均;(5)按照公式五求每一个频率点出现的概率;公式五,<img file="87400dest_path_image006.GIF" wi="79" he="58" />式中:Pj——表示第j个频率值占总频率值的比重;Yj(k) ——表示第j个频率值在时间上的平均;S(k) ——表示各频率值之和;(6)按照公式六对第j频域点求信息量;公式六,<img file="311708dest_path_image007.GIF" wi="175" he="54" />式中:I(Pj) ——标志第j频率点的信息量;Pj——表示第j个频率值占总频率值得比重;通过上述计算过程分别将待测语音信号和原始语音信号转换为一维数据;步骤二、选取步骤一中语音信号的前N/2个频率点的信息量作为初步特征;步骤三、从语音信号选取的初步特征中低频区特征提取部分中筛选特征集,并选取连续的频率点作为最终特征集;步骤四:通过分类器分别对回放语音信号的特征集和原始语音信号的特征集进行训练模型,将待测语音在训练模型上进行测试,并由分类器最终判断待测语音信号是否为回放语音。 |
地址 |
315211 浙江省宁波市江北区风华路818号 |