发明名称 |
混合语音识别 |
摘要 |
所要求的主题包括一种用于识别来自源的混合语音的系统和方法。该方法包括训练第一神经网络以识别来自混合语音样本的讲话者所讲出的具有较高水平的语音特征的语音信号。该方法还包括训练第二神经网络以识别来自混合语音样本的讲话者所讲出的具有较低水平的语音特征的语音信号。此外,该方法包括通过在考虑特定帧是语音特征的切换点的概率的情况下对观察到两个语音信号的联合可能性进行优化而利用该第一神经网络和第二神经网络对该混合语音样本进行解码。 |
申请公布号 |
CN106104674A |
申请公布日期 |
2016.11.09 |
申请号 |
CN201580016161.2 |
申请日期 |
2015.03.19 |
申请人 |
微软技术许可有限责任公司 |
发明人 |
俞栋;翁超;M·L·塞尔特泽尔;J·德罗波 |
分类号 |
G10L15/16(2006.01)I;G10L15/06(2013.01)I;G10L15/20(2006.01)I |
主分类号 |
G10L15/16(2006.01)I |
代理机构 |
北京市金杜律师事务所 11256 |
代理人 |
王茂华 |
主权项 |
一种用于识别来自源的混合语音的方法,包括:训练第一神经网络以识别来自混合语音样本的、由讲话者讲出的、具有较高水平的语音特征的语音信号;训练第二神经网络以识别来自所述混合语音样本的、由讲话者讲出的、具有较低水平的所述语音特征的语音信号;以及通过对观察到两个所述语音信号的联合可能性进行优化而利用所述第一神经网络和所述第二神经网络对所述混合语音样本进行解码。 |
地址 |
美国华盛顿州 |