发明名称 |
基于深度置信网络特征矢量的信道鲁棒声纹识别系统 |
摘要 |
本发明属于语音信号处理与机器学领域,涉及一个基于深度置信网络特征矢量的信道鲁棒声纹识别系统,由语音采集及预处理模块、原始谱特征提取模块、深度置信网络训练模块、说话人声纹特征矢量提取模块、说话人声学模型生成模块和说话人身份鉴定模块构成。通过来自不同信道的语音数据和相对应的说话人身份编号,有监督地训练一个深度置信网络,并提出了一种判别比值选择具有最佳类别区分性的深度置信网络隐含层输出来构造说话人声纹特征矢量,该特征矢量具有信道鲁棒性。相比于传统的基于i‑vector的说话人确认系统,本系统在信道失配情况下具有更高的声纹识别准确率。 |
申请公布号 |
CN106448684A |
申请公布日期 |
2017.02.22 |
申请号 |
CN201611006202.2 |
申请日期 |
2016.11.16 |
申请人 |
北京大学深圳研究生院 |
发明人 |
邹月娴;王迪松;黄艺驰;柳俊宏 |
分类号 |
G10L17/04(2013.01)I;G10L17/18(2013.01)I;G10L17/20(2013.01)I |
主分类号 |
G10L17/04(2013.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一个基于深度置信网络特征矢量的信道鲁棒声纹识别系统,对说话人身份进行鉴定,其特征在于,所述系统包括:语音采集及预处理模块,用于采集所述说话人的语音信号,并对语音信号进行预处理;原始谱特征提取模块,用于对预处理后的语音进行原始谱特征MFCC提取;深度置信网络训练模块,用于有监督训练一个信道鲁棒的特征矢量提取器;说话人声纹特征矢量提取模块,利用所述训练好的深度置信网络进行信道鲁棒的说话人声纹特征矢量提取;说话人声学模型生成模块,根据提取的所述说话人声纹特征矢量,对所述说话人进行声学建模;说话人身份鉴定模块,将待测试说话人的所述声学模型与注册说话人的所述声学模型进行比较评分,确定待测试说话人的身份。 |
地址 |
518055 广东省深圳市南山区西丽大学城北大园区 |