发明名称 |
声纹认证处理方法及装置 |
摘要 |
本申请提出一种声纹认证处理方法和装置,其中,该方法包括:应用混合性别的深度神经网络DNN声纹基线系统,提取训练集中每条语音的第一特征向量;根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器;根据所述训练集中不同性别的语音数据,分别训练不同性别的DNN模型;根据不同性别的DNN模型以及所述训练集中不同性别的语音数据,分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。建立了区分性别的声纹认证处理模型,以便提高了声纹认证的效率和准确性。 |
申请公布号 |
CN105513597A |
申请公布日期 |
2016.04.20 |
申请号 |
CN201511024873.7 |
申请日期 |
2015.12.30 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
李超;吴本谷;朱林 |
分类号 |
G10L17/00(2013.01)I;G10L17/04(2013.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;H04L29/06(2006.01)I |
主分类号 |
G10L17/00(2013.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
宋合成 |
主权项 |
一种声纹认证处理方法,其特征在于,包括以下步骤:应用混合性别的深度神经网络DNN声纹基线系统,提取训练集中每条语音的第一特征向量;根据所述每条语音的第一特征向量以及预先标注的性别标签训练性别分类器;根据所述训练集中不同性别的语音数据,分别训练不同性别的DNN模型;根据不同性别的DNN模型以及所述训练集中不同性别的语音数据,分别训练不同性别的统一背景模型、特征向量提取模型、以及概率线性判别分析模型。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |