发明名称 |
情感语音合成方法和装置 |
摘要 |
本发明提供了情感语音合成方法和装置。根据本发明的一个方面,提供了一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。 |
申请公布号 |
CN102005205A |
申请公布日期 |
2011.04.06 |
申请号 |
CN200910170713.1 |
申请日期 |
2009.09.03 |
申请人 |
株式会社东芝 |
发明人 |
栾剑;李健 |
分类号 |
G10L13/02(2006.01)I;G10L13/04(2006.01)I |
主分类号 |
G10L13/02(2006.01)I |
代理机构 |
北京市中咨律师事务所 11247 |
代理人 |
于静;刘瑞东 |
主权项 |
一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。 |
地址 |
日本东京都 |