发明名称 一种基于比特平面的感知音频分级编码系统及方法
摘要 本发明涉及音频编码技术领域,尤其涉及一种基于比特平面的感知音频分级编码系统及方法。本发明针对中低码率条件下码率限制的需求,设计了一种三层的分级编码方法,第一层为核心编码层,第二层为第一增强层,第三层为第二增强层,其中分级编码增强层包括残差提取模块、子带划分模块、基于比特平面感知测度计算模块、比特分配模块、矢量量化模块。本发明根据平均比特平面作为子带的优先级的可分级码率分配策略,相比能量作为感知重要度具有更明显的指导意义。
申请公布号 CN102074243B 申请公布日期 2012.09.05
申请号 CN201010608697.2 申请日期 2010.12.28
申请人 武汉大学 发明人 胡瑞敏;杨玉红;高丽;杨裕才;曾琦;陈先念;王国英
分类号 G10L19/14(2006.01)I;G10L19/02(2006.01)I 主分类号 G10L19/14(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 1.一种基于比特平面的感知音频分级编码系统,其特征在于:预处理模块:对输入信号进行预处理,其输入为音频原始信号,输出为预处理后的信号,预处理后的信号做两路输出:一路输出给核心编码器模块;一路输出给分级编码增强层中的残差提取模块;核心编码器模块:本模块输入为预处理后的信号,采用通用的核心编码方法对预处理后的信号进行编码,编码后作两路输出:其中一路作为码流的一部分输出给解码端;一路解码后得到解码重构信号输出给残差提取模块;残差提取模块:预处理后的信号和解码重构后的信号作为本模块的输入,得到残差信号,输出给子带划分模块;子带划分模块:残差提取模块得到的残差信号作为本模块的输入,首先对残差信号进行感知加权域的滤波处理,然后经过时频变换,变换后的频域信号再进行子带的划分,得到频域子带残差信号,一路输出给基于比特平面的感知信息计算模块;另一路输出给矢量量化模块;基于比特平面的感知信息计算模块:频域子带残差信号作为本模块的输入,计算每个子带基于比特平面的感知测度,然后对感知测度值按照从大到小的顺序进行排列和熵编码,作为增强层码流的一部分;另一路将排序好的子带编号和感知测度输出给比特分配模块;所述基于比特平面的感知信息计算模块通过计算每个子带的绝对平均值,对子带绝对平均值求取其最大比特平面,以最大比特平面为依据计算感知测度;计算公式如下:<img file="FDA00001641224200011.GIF" wi="709" he="60" />k=1,2......16其中ip(k)为第k个子带的感知测度,s<sub>k</sub>为第k个子带感知加权值,<img file="FDA00001641224200012.GIF" wi="92" he="61" />为第k个子带平均值的最大比特平面数;比特分配模块:排序好的子带编号和子带感知测度作为本模块的输入,按照排序结果和感知测度对每个子带进行比特数的分配,将分配的比特数输出给矢量量化模块;矢量量化模块:分配的比特数作为本模块的输入,根据子带分配的比特数进行矢量量化,作为增强层码流的一部分输出给解码端。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学