发明名称 基于一对多码书映射的语音转换方法
摘要 本发明公开了一种基于一对多码书映射的语音转换方法,对源语音码书与目标语音码书的一对多映射关系的建立,从平行数据库中随机提取一部分语音,对齐并提取声道参数后快速建立源与目标语音码书;估算用于训练的数据中源与目标特征参数对应于其各自码书的权重,通过统计与分析二者的关系来建立源与目标语音的权重映射关系,进而掌握个性特征的映射规则,实现高质量、快速的语音转换,能够解决实际环境中语音转换系统的实时性、转换后相似度的问题,最终在对语音转换实时性追求的过程中减小转换效果的代价,从而提高转换结果与目标语音的相似度,具有良好的应用前景。
申请公布号 CN103886859B 申请公布日期 2016.08.17
申请号 CN201410050758.6 申请日期 2014.02.14
申请人 河海大学常州校区 发明人 徐宁;胡芳;鲍静益;刘小峰;汤一彬;蒋爱民
分类号 G10L25/93(2013.01)I;G10L21/00(2013.01)I 主分类号 G10L25/93(2013.01)I
代理机构 南京纵横知识产权代理有限公司 32224 代理人 董建林
主权项 基于一对多码书映射的语音转换方法,其特征在于:包括以下步骤,步骤(1),训练阶段,用于建立源码书与目标码书的一对多关系,包括以下步骤,(A)对平行的语音数据采用谐波随机模型进行语音分析;(B)从语音分析得到的模型参数中提取声道特征参数和基音频率;(C)利用动态时间规整算法将源和目标的声道特征参数进行对齐;(D)从对齐的特征参数中随机提取部分数据作为码书,码书包括源语音码书和目标码书;(E)将剩余与码书不重叠的对齐数据作为训练数据,分别估算并统计源与目标的声道特征参数在各自目标码书中对应的权重,分析统计源语音与对应目标语音的权重的映射关系;(F)通过分析统计的权重关系,建立源语音与目标码书的一对多映射关系;步骤(2),转换阶段,用于实现语音特征的映射,合成转换后的语音,以下步骤,(H)根据建立源语音与目标码书的一对多映射关系,实现对语音特征的映射;(G)进行参数内插和相位补偿,合成转换后的语音。
地址 213022 江苏省常州市晋陵北路200号