发明名称 |
一种非周期成分音节模型建立、及语音合成的方法和设备 |
摘要 |
本发明公开了一种非周期成分音节模型建立、及语音合成的方法和设备,包括:根据原始语音波形文件中每一个音节的每一帧在划分得到的每一个频带信息上的非周期成分代表值,利用离散余弦变换方法得到该音节在选择频带信息上的非周期成分谱拟合曲线,生成包含了所述原始语音波形文件的每一个音节在不同频带信息上的非周期成分谱拟合曲线的非周期成分音节模型,这样将音节模型中包含频段数量*音节帧数的数据信息,转换成为包含频段数量的拟合曲线,缩小了语音建模的规模,节省了系统资源,同时在建立每一音节的非周期成分谱拟合曲线,充分考虑了音节的帧与帧之间的连续性,使得拟合曲线保留了音节原有的音质,并在合成时提高了合成语音的质量。 |
申请公布号 |
CN104282300A |
申请公布日期 |
2015.01.14 |
申请号 |
CN201310282732.X |
申请日期 |
2013.07.05 |
申请人 |
中国移动通信集团公司 |
发明人 |
王朝民;刘琨;焦伟 |
分类号 |
G10L13/02(2013.01)I;G10L13/04(2013.01)I |
主分类号 |
G10L13/02(2013.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
郭润湘 |
主权项 |
一种非周期成分音节模型建立的方法,其特征在于,包括:分解语音数据库中的原始语音波形文件,得到所述原始语音波形文件中每一个音节的非周期成分谱信息、基频信息和声道谱信息;根据预设的为音节的每一帧划分的至少一个频带信息和音节的非周期成分谱信息,计算所述原始语音波形文件中每一个音节的每一帧在划分得到的每一个频带信息上的非周期成分代表值;针对所述原始语音波形文件中任意一个音节,依次执行以下操作,直至得到所述原始语音波形文件中每一个音节在划分的每一个频带信息上的非周期成分谱拟合曲线:选择一个频带信息,查找在该频带信息上该音节对应的每一帧的非周期成分代表值,并根据查找到的非周期成分代表值,利用离散余弦变换方法得到该音节在选择的频带信息上的非周期成分谱拟合曲线;判断该音节是否已得到划分的每一个频带信息上的非周期成分谱拟合曲线,若是,则选择下一个音节,继续执行得到该音节在划分的每一个频带信息上非周期成分拟合曲线的操作;否则,选择下一个频带信息,继续执行得到该音节在选择的下一个频带信息上非周期成分拟合曲线的操作;在得到的所述原始语音波形文件中每一个音节在划分的每一个频带信息上的非周期成分谱拟合曲线后,建立原始语音波形文件的标注文件与所述原始语音波形文件的每一个音节信息之间的对应关系,并根据建立的对应关系生成非周期成分音节模型,其中,所述每一个音节信息中包含了每一个音节的基频信息、声道谱信息以及在不同频带信息上的非周期成分谱拟合曲线。 |
地址 |
100032 北京市西城区金融大街29号 |