一种基于文本信息的波形拼接语音合成方法,申请号CN201410816486.6-传众专利搜索

发明名称	一种基于文本信息的波形拼接语音合成方法
摘要	本发明公开了一种基于文本信息的波形拼接语音合成方法，该方法包括以下步骤：通过音段切分，提取原始音频中所有基元的声学参数与文本参数，根据提取的参数训练时长预测模型与训练权重预测模型；采用分层预选方法，进行分层预选，利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选，获得候选基元；对目标基元、候选基元和权重预测模型预测的权重信息计算，获得目标代价；对相邻两个基元的契合度进行计算，得到拼接代价；用维特比搜索方法对目标代价和拼接代价进行搜索，得到最小代价路径，进而得到最佳基元并经过平滑拼接得到合成语音。本发明提高了合成语音的效率，增强拼接合成的实时性并提高了合成语音的韵律表现。
申请公布号	CN104575488A	申请公布日期	2015.04.29
申请号	CN201410816486.6	申请日期	2014.12.25
申请人	北京时代瑞朗科技有限公司	发明人	徐明星
分类号	G10L13/02(2013.01)I;G10L13/08(2013.01)I	主分类号	G10L13/02(2013.01)I
代理机构		代理人
主权项	一种基于文本信息的波形拼接语音合成方法，其特征在于：该方法包括以下步骤：步骤S1：通过音段切分，提取原始音频中所有基元的声学参数与文本参数，根据提取的参数训练时长预测模型与训练权重预测模型；步骤S2：采用分层预选方法，进行分层预选，利用文本分析的目标基元、时长预测模型预测的时长对语料库中的基元进行初步预选，获得候选基元；步骤S3：对目标基元、候选基元和权重预测模型预测的权重信息计算，获得目标代价；对相邻两个基元的契合度进行计算，得到拼接代价；用维特比搜索方法对目标代价和拼接代价进行搜索，得到最小代价路径，进而得到最佳基元并经过平滑拼接得到合成语音。
地址	100085 北京市海淀区上地东路35号1-510-532