发明名称 |
一种基于文本信息的波形拼接语音合成方法 |
摘要 |
本发明公开了一种基于文本信息的波形拼接语音合成方法,该方法包括以下步骤:通过音段切分,提取原始音频中所有基元的声学参数与文本参数,根据提取的参数训练时长预测模型与训练权重预测模型;采用分层预选方法,进行分层预选,利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选,获得候选基元;对目标基元、候选基元和权重预测模型预测的权重信息计算,获得目标代价;对相邻两个基元的契合度进行计算,得到拼接代价;用维特比搜索方法对目标代价和拼接代价进行搜索,得到最小代价路径,进而得到最佳基元并经过平滑拼接得到合成语音。本发明提高了合成语音的效率,增强拼接合成的实时性并提高了合成语音的韵律表现。 |
申请公布号 |
CN104575488A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201410816486.6 |
申请日期 |
2014.12.25 |
申请人 |
北京时代瑞朗科技有限公司 |
发明人 |
徐明星 |
分类号 |
G10L13/02(2013.01)I;G10L13/08(2013.01)I |
主分类号 |
G10L13/02(2013.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于文本信息的波形拼接语音合成方法,其特征在于:该方法包括以下步骤:步骤S1:通过音段切分,提取原始音频中所有基元的声学参数与文本参数,根据提取的参数训练时长预测模型与训练权重预测模型;步骤S2:采用分层预选方法,进行分层预选,利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选,获得候选基元;步骤S3:对目标基元、候选基元和权重预测模型预测的权重信息计算,获得目标代价;对相邻两个基元的契合度进行计算,得到拼接代价;用维特比搜索方法对目标代价和拼接代价进行搜索,得到最小代价路径,进而得到最佳基元并经过平滑拼接得到合成语音。 |
地址 |
100085 北京市海淀区上地东路35号1-510-532 |