发明名称 一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法
摘要 本发明请求保护一种基于MELP的1.2kb/s低速率语音编解码方法,包括:编码端首先对语音信号以30ms为子帧长度进行分帧处理,将相邻两子帧组成一个超帧,对提取的语音特征参数LSF、Pitch、VP、Fsmag和G进行多帧联合量化编码。利用帧结构中剩余比特对重要的语音特征参数进行差错控制编码,最后组成二进制比特流进行传送。解码端从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构,利用重构的语音特征参数生成激励信号,再经过自适应谱增强、合成滤波器、增益控制和散布脉冲滤波后得到合成的语音信号。本发明能有效地降低语音编码速率,接收端合成的语音具有较高的清晰度和可懂度。
申请公布号 CN105118513A 申请公布日期 2015.12.02
申请号 CN201510434127.9 申请日期 2015.07.22
申请人 重庆邮电大学 发明人 李强;付余涛;舒勤军;陈丁当;陈浩;朱兰;明艳;夏绪玖
分类号 G10L19/087(2013.01)I 主分类号 G10L19/087(2013.01)I
代理机构 重庆市恒信知识产权代理有限公司 50102 代理人 刘小红
主权项 一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法,其特征在于,包括编码端的编码步骤及解码端的解码步骤,其中编码端的编码步骤具体为:101、在编码端,根据编码器的输出码率和处理帧的长度计算出编码帧长,确定语音特征参数,包括线谱对频率LSF、基音周期Pitch、增益G、非周期标志、残差谐波幅度Fsmag、带通清/浊音强度VP量化所用的比特数,设计出编码帧结构;102、输入语音信号,首先对输入的语音信号进行预处理,滤除工频干扰信号,截取M1ms长度的语音信号为一子帧,两个子帧组成一个超帧;103、设计编码数据缓存器结构,确定分析语音特征参数所用的窗函数的中心位置;104、采用步骤103中确定的窗函数对语音信号进行截断处理后,提取子帧的语音特征参数,以超帧为单位,对语音特征参数进行联合量化;105、利用编码后超帧结构中的剩余比特将步骤104所得的语音特征参数进行差错控制编码,组成二进制比特流后,传送给解码端;在解码端,解码端的解码步骤为:106、解码端接收编码端发送来的比特流,并从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构;107、根据步骤106解析出的基音周期Pitch值判断该子帧的清/浊状态,若为浊音子帧时,利用残差谐波幅度Fsmag和带通清/浊音强度VP生成周期性脉冲激励信号;如果为清音子帧,激励为白噪声信号。激励信号经过合成滤波器后,得到重构的语音信号;108、对重构的语音信号进行增益调整和脉冲散布滤波,得到最终合成的语音信号。
地址 400065 重庆市南岸区黄桷垭崇文路2号