发明名称 基于感知自适应比特分配的音频精细分级编码方法及系统
摘要 本发明涉及音频编码技术领域,尤其涉及一种基于感知自适应比特分配的音频精细分级编码方法及系统。本发明方法对输入信号进行预处理、对频域信号进行子带划分、计算每个子带的感知重要度,并根据感知重要度按照从大到小的顺序统一对子带排序,提取感知重要度最大的子带、进行可分级纵向矢量量化、对矢量量化后的最大重要感知重要度子带进行自适应调整;本发明系统包括预处理模块、子带划分模块、子带感知重要度计算排序及提取模块、分级量化编码模块、自适应调整模块、分级编码结束判断模块。本发明实现了高效的精细可分级音频编码,较好地实现了量化精度和量化效率的统一,提高编码效率的同时也满足了高音质的需求。
申请公布号 CN101800050B 申请公布日期 2012.10.10
申请号 CN201010107402.3 申请日期 2010.02.03
申请人 武汉大学 发明人 胡瑞敏;杨玉红;刘元元;陈冰;高丽;项慨;周超群;杭波
分类号 G10L19/02(2006.01)I 主分类号 G10L19/02(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 1.一种基于感知自适应比特分配的音频精细分级编码方法,其特征在于,包括以下步骤:步骤①:对增强层输入信号进行预处理,其中预处理包括对增强层输入信号进行感知加权处理和时频变化处理,经上述预处理后得到信号的频域表示形式;步骤②:对上述经过预处理后得到的频域信号进行子带划分,按照均匀划分的方法将整个频域划分为N个子带,其中N≥1;步骤③:计算每个子带的感知重要度,并根据感知重要度按照从大到小的顺序统一对子带排序,提取感知重要度最大的子带;步骤④:根据感知重要度最大的子带,进行可分级矢量量化;所述步骤④进一步包括以下子步骤:定义VQ_rank(k)为第k个子带的量化等级,并对其初始化赋值为:VQ_rank(0)=VQ_rank(1)...=VQ_rank(N-1)=0其中k=0,1,....N-1,N为划分的子带总数,N≥1;对获得的感知重要度最大的子带k进行第VQ_rank(k)级的矢量量化,给频谱矢量Y<sub>k</sub>分配R比特,得到量化后的矢量<img file="FDA00001822475600011.GIF" wi="65" he="74" />其中R取值大小由分级编码器的分级粒度S决定;步骤⑤:对矢量量化后的感知重要度最大的子带进行自适应调整,所述可分级量化次数Q的初始化值Q=1;所述步骤⑤进一步包括以下子步骤:设ip(k)为Y<sub>k</sub>的感知重要度,计算<img file="FDA00001822475600012.GIF" wi="38" he="73" />的感知重要度<img file="FDA00001822475600013.GIF" wi="124" he="74" />并对Y<sub>k</sub>,VQ_rank(k)及ip(k)进行如下自适应修改:<maths num="0001"><![CDATA[<math><mrow><msub><mi>Y</mi><mi>k</mi></msub><mo>=</mo><msub><mi>Y</mi><mi>k</mi></msub><mo>-</mo><msub><mover><mi>Y</mi><mo>^</mo></mover><mi>k</mi></msub></mrow></math>]]></maths>VQ_rank(k)=VQ_rank(k)+1<maths num="0002"><![CDATA[<math><mrow><mi>ip</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mi>ip</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mover><mrow><mi>ip</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>^</mo></mover></mrow></math>]]></maths>Q=Q+1其中,0≤k≤N-1;步骤⑥:判断整个量化过程中可分级量化次数是否到达最大次数Q<sub>max</sub>,如果没有达到最大次数,则返回步骤③,如果达到最大次数,则结束分级编码。
地址 430072 湖北省武汉市武昌珞珈山