发明名称 一种数字音频粗分层编码方法和装置
摘要 本发明涉及一种数字音频粗分层编码方法和装置。所述方法包括:S1、将数字音频信号分为一基本层和至少一增强层;S2、对所述一基本层和至少一增强层分别进行编码;所述步骤S1进一步包括:S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层。本发明避免了精细分层引起的编码效率下降,实现简单,能获取最佳综合声音质量,易于满足信道编码要求,并且不需要精细分层时的各种限制条件,保证更高效率的压缩。
申请公布号 CN103165135A 申请公布日期 2013.06.19
申请号 CN201310067789.8 申请日期 2013.03.04
申请人 深圳广晟信源技术有限公司 发明人 闫建新;王磊
分类号 G10L19/20(2013.01)I;G10L19/008(2013.01)I 主分类号 G10L19/20(2013.01)I
代理机构 深圳市顺天达专利商标代理有限公司 44217 代理人 李琴
主权项 一种数字音频粗分层编码方法,其特征在于,包括如下步骤:S1、将数字音频信号分为一基本层和至少一增强层;S2、对所述一基本层和至少一增强层分别进行编码;其中,所述步骤S1进一步包括:S11、对于单声道音频信号,基于频带或残差分层结构将其分为一基本层和至少一增强层;S12、对于立体声音频信号,基于频带、声道、参数立体声编码或残差分层结构将其分为一基本层和至少一增强层;S13、对于多声道音频信号,基于频带、声道、或残差分层结构将其分为一基本层和至少一增强层;其中,所述基于频带将数字音频信号分为一基本层和至少一增强层进一步包括:依次从低频到高频将每个频段的音频编码信息放入所述一基本层和至少一增强层;所述基于声道将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输至少一声道,由所述至少一增强层传输至少另一声道,且所述基本层传输的声道的数量小于等于所述至少一增强层传输的声道的数量;所述基于参数立体声将数字音频信号分为一基本层和至少一增强层进一步包括:由所述基本层传输立体声道对缩混的单个声道,由所述至少一增强层传输参数立体声信息;所述基于残差分层结构将数字音频信号分为一基本层和至少一增强层进一步包括:根据基本层的码率要求对数字音频信号进行编码并将编码后的数据放入基本层;将数字音频信号与基本层解码恢复到的信号进行比较获得第一级残差信号并对所述第一级残差信号进行编码后放入第一级增强层;从上一级残差信号中去除上一级增强层解码恢复到的信号获得下一级残差信号并对所述 下一级残差信号进行编码后放入下一级增强层;其中,所述基于声道将数字音频信号分为一基本层和至少一增强层还进一步包括:在数据帧总字节数一定的前提下,基于基本层强调配置方案、均匀配置方案、近均匀配置方案或受限配置方案对所述一基本层和至少一增强层分别配置字节数;其中,所述基本层强调配置方案包括:分配给所述一基本层的字节数大于等于分配给所述至少一增强层的字节数;所述均匀配置方案包括:对所述一基本层和所述至少一增强层的每个全频带声道分配同样的字节数;所述近均匀配置方案包括:对所述基本层中每个全频带声道配置的字节数为(数据帧总字节数/基本层包含的全频带声道数),且(数据帧总字节数/2)>(数据帧总字节数/基本层包含的全频带声道数)>(数据帧总字节数/(基本层包含的全频带声道数+增强层包含的全频带声道数));对增强层中的一声道配置的字节数大于(数据帧总字节数*(1‑1/基本层包含的全频带声道数))/增强层包含的全频带声道数,而对增强层中其余至少一声道配置的字节数小于(数据帧总字节数*(1‑1/基本层包含的全频带声道数))/增强层包含的全频带声道数;所述受限配置方案包括:根据每一传输帧中LDPC编码的块大小、信道编码条件、所述基本层的特性和/或所述增强层的特性,对所述基本层和增强层分别配置字节数。
地址 518057 广东省深圳市南山区高新区中区高新中一道9号软件大厦6楼