发明名称 一种唱歌模仿的方法与装置
摘要 本发明提出了一种唱歌模仿的方法,包括:预备好源演唱者和目标演唱者对应音频素材;使用STRAIGHT模型分析源演唱者和目标演唱者的声音特征;使用高斯混合模型训练得到源演唱者与目标演唱者的联合GMM模型;音色转换过程中使用基于帧间关联的高斯转换函数;将源演唱者的音色与目标演唱者音色按比例混合;使用STRAIGHT模型重建具有目标演唱者音色的声音;本发明还提供了实现上述方法的装置。本发明可以将源演唱者的声音转换为具有目标演唱者音色的声音,转换音质良好,音色接近目标演唱者,并且可以按比例加入目标演唱者的音色特征;特别地,当目标演唱者是歌星时,可以极大地提高数字视听场所用户演唱的自信心以及趣味性,并提高用户模仿歌星音色的水平。
申请公布号 CN104464725A 申请公布日期 2015.03.25
申请号 CN201410839900.5 申请日期 2014.12.30
申请人 福建星网视易信息系统有限公司 发明人 王子亮;邹应双
分类号 G10L15/06(2013.01)I;G10L13/02(2013.01)I 主分类号 G10L15/06(2013.01)I
代理机构 福州市景弘专利代理事务所(普通合伙) 35219 代理人 林祥翔;吕元辉
主权项 一种唱歌模仿的方法,其特征在于,所述方法用于将源演唱者的声音转换为具有目标演唱者音色的声音,该方法包括训练阶段和转换阶段,其中:所述训练阶段包括:利用STRAIGHT模型对源演唱者和目标演唱者对应的音频素材分别计算基频序列值以及频谱包络系数,根据源演唱者的频谱包络系数提取源演唱者的LSF系数,根据目标演唱者的频谱包络系数提取目标演唱者的LSF系数;利用DTW算法对齐并组合源演唱者和目标演唱者的LSF系数;将组合的LSF系数进行GMM训练得到源演唱者与目标演唱者的联合GMM模型,根据联合GMM模型均值与方差,并引入帧间关联,推导出源演唱者到目标演唱者的特征映射函数;使用单高斯模型推导出源演唱者到目标演唱者的基频映射函数;所述转换阶段包括:利用STRAIGHT模型对待转换的源演唱者的音频素材计算基频序列值以及频谱包络系数,并根据所述频谱包络系数提取待转换的源演唱者的LSF系数;根据特征映射函数,对待转换的源演唱者的LSF系数进行转换,根据基频映射函数,对待转换的源演唱者的基频序列值进行转换;根据转换后的LSF系数计算得到转换后的频谱包络系数;根据转换后的频谱包络系数与转换后的基频序列值,利用STRAIGHT模型重建得到具有目标演唱者音色的声音。
地址 350028 福建省福州市仓山区金山大道618号桔园洲工业区星网锐捷科技园20号楼四层