发明名称 一种低码率语音编码器以及解码器
摘要 本发明涉及一种低码率语音编码器包括语音信号预处理模块,梅尔倒谱系数提取模块以及参数量化模块。本发明还涉及一种低码率语音解码器包括:参数反量化模块,幅度谱重建模块,最小相位信号重建模块,GMM特征提取及参数训练系统,清浊音估计模块,基音估计模块,Rosenberg脉冲产生模块,语音信号重建模块以及叠接相加模块。本发明采用基于人耳听觉模型的梅尔倒谱系数作为编解码参数,使得编解码器可以有效去除非人耳听觉范围内的冗余信息。本发明提出在编码器无需计算清浊音和基音信息,只需在解码器基于梅尔倒谱系数通过估计算法得到,不仅有能降低编码器的算法复杂度,还进一步有效减小所要量化传输的参数。
申请公布号 CN103854655B 申请公布日期 2016.10.19
申请号 CN201310732544.2 申请日期 2013.12.26
申请人 上海交通大学 发明人 江文斌;郭栗;曹一鸣;刘佩林
分类号 G10L19/16(2013.01)I 主分类号 G10L19/16(2013.01)I
代理机构 上海汉声知识产权代理有限公司 31236 代理人 胡晶
主权项 一种低码率语音解码器,其特征在于,包括:参数反量化模块,将量化后的MFCC进行反量化,得到量化前的MFCC;幅度谱重建模块,通过MFCC恢复得到语音信号的幅度谱;最小相位信号重建模块,根据语音信号的幅度谱得出最小相位信号;GMM特征提取及参数训练系统,通过对一训练语音信号进行处理,输出基音估计的GMM参数以及清浊音估计的GMM参数;清浊音估计模块,与所述幅度谱重建模块输出端相连,对重建后的幅度谱采用所述清浊音估计的GMM参数求概率进行估计,与阈值比较进行清浊音判决;基音估计模块,与所述清浊音估计模块输出端相连,对估计为浊音帧的幅度谱采用所述基音估计的GMM参数进行基音估计;Rosenberg脉冲产生模块,与所述基音估计模块输出端相连,根据估计出的基音产生Rosenberg脉冲用于模拟语音信号产生声门脉冲;语音信号重建模块,与所述Rosenberg脉冲产生模块以及所述最小相位信号重建模块的输出端相连,对清音帧和浊音帧分别进行重建;以及叠接相加模块,与所述语音信重建模块的输出端相连,将重建后的清音帧和浊音帧进行帧间叠加,得到完整的语音信号。
地址 200240 上海市闵行区东川路800号