发明名称 用于压缩高阶高保真立体声(HOA)信号的方法、用于解压缩压缩的HOA信号的方法、用于压缩HOA信号的装置以及用于解压缩压缩的HOA信号的装置
摘要 一种用于压缩HOA信号的方法包括输入时间帧的空间HOA编码以及随后的感知编码和源编码,该HOA信号是具有HOA系数序列的输入时间帧(C<sub>(k)</sub>)的输入HOA表示。将每个输入时间帧分解(802)为主导声音信号(X<sub>PS</sub>(k‑1))的帧和环境HOA分量(C<sub>AMB</sub>(k‑1))的帧。环境HOA分量(C<sub>AMB</sub>(k‑1))在分层模式下包括在较低位置的输入HOA表示(c<sub>n</sub>(k‑1))的第一HOA系数序列以及在其余的较高的位置的第二HOA系数序列(c<sub>AMB,n</sub>(k‑1))。第二HOA系数序列是输入HOA表示和主导声音信号的HOA表示之间的残差的HOA表示的一部分。
申请公布号 CN106463123A 申请公布日期 2017.02.22
申请号 CN201580014972.9 申请日期 2015.03.20
申请人 杜比国际公司 发明人 S·科尔多恩;A·克鲁格;O·伍埃博尔特
分类号 G10L19/008(2006.01)I;G10L19/24(2006.01)I 主分类号 G10L19/008(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 宿小猛
主权项 一种用于压缩高阶高保真立体声(HOA)信号的方法(800),所述HOA信号是具有HOA系数序列的输入时间帧(C(k))的、阶次为N的输入HOA表示,所述方法包括所述输入时间帧的空间HOA编码以及随后的感知编码和源编码,其中,所述空间HOA编码包括以下步骤:‑在方向和矢量估计模块(301)中执行所述HOA信号的方向和矢量估计处理(801),其中,包括关于方向信号的第一元组集合<img file="FDA0001116769600000011.GIF" wi="235" he="78" />和关于基于矢量的信号的第二元组集合<img file="FDA0001116769600000012.GIF" wi="254" he="75" />的数据被获得,所述第一元组集合<img file="FDA0001116769600000013.GIF" wi="238" he="73" />中的每个包括方向信号的索引和相应的量化方向,所述第二元组集合中<img file="FDA0001116769600000014.GIF" wi="174" he="59" />的每个包括基于矢量的信号的索引和限定所述信号的方向分布的矢量;‑在HOA分解模块(303)中将所述HOA系数序列的每个输入时间帧分解(802)为多个主导声音信号(X<sub>PS</sub>(k‑1))的帧和环境HOA分量<img file="FDA0001116769600000015.GIF" wi="318" he="73" />的帧,其中,所述主导声音信号(X<sub>PS</sub>(k‑1))包括所述方向声音信号和所述基于矢量的声音信号,并且其中,所述分解(702)进一步提供预测参数(ξ(k‑1))和目标分配矢量(v<sub>A,T</sub>(k‑1)),所述预测参数ξ(k‑1)描述如何从所述主导声音信号(X<sub>PS</sub>(k‑1))内的方向信号预测所述HOA信号表示的各部分以便丰富主导声音HOA分量,所述目标分配矢量(v<sub>A,T</sub>(k‑1))包含关于如何将所述主导声音信号分配给给定数量(I个)通道的信息;‑在环境分量修正模块(304)中根据所述目标分配矢量(v<sub>A,T</sub>(k‑1))提供的信息修正(803)所述环境HOA分量(C<sub>AMB</sub>(k‑1)),其中,根据主导声音信号占据多少个通道,确定所述环境HOA分量(C<sub>AMB</sub>(k‑1))的哪些系数序列将在所述给定数量(I个)通道中传输,并且其中,修正的环境HOA分量(C<sub>M,A</sub>(k‑2))和时间预测的修正的环境HOA分量(C<sub>P,M,A</sub>(k‑1))被获得,并且其中,最终的分配矢量(v<sub>A</sub>(k‑2))从所述目标分配矢量(v<sub>A,T</sub>(k‑1))中的信息获得;‑在通道分配模块(105)中使用所述最终的分配矢量(v<sub>A</sub>(k‑2))提供的信息将从所述分解获得的主导声音信号(X<sub>PS</sub>(k‑1))以及修正的环境HOA分量(C<sub>M,A</sub>(k‑2))和时间预测的修正的环境HOA分量(C<sub>P,M,A</sub>(k‑1))的确定的系数序列分配给(804)所述给定数量(I个)通道,其中,输送信号y<sub>i</sub>(k‑2),i=1,...,I和预测的输送信号y<sub>P,i</sub>(k‑2),i=1,...,I被获得;‑在多个增益控制模块(306)中对所述输送信号(y<sub>i</sub>(k‑2))和所述预测的输送信号(y<sub>P,i</sub>(k‑2))执行增益控制(805),其中,增益修正的输送信号(z<sub>i</sub>(k‑2))、指数(e<sub>i</sub>(k‑2))和异常标志(β<sub>i</sub>(k‑2))被获得;并且,所述感知编码和源编码包括以下步骤:‑在感知编码器(310)中对所述增益修正的输送信号(z<sub>i</sub>(k‑2))进行感知编码(806),其中,感知编码的输送信号<img file="FDA0001116769600000021.GIF" wi="390" he="61" />被获得;‑在副信息源编码器(320、330)中对副信息进行编码(807),所述副信息包括所述指数(e<sub>i</sub>(k‑2))和异常标志(β<sub>i</sub>(k‑2))、所述第一元组集合<img file="FDA0001116769600000022.GIF" wi="238" he="75" />和第二元组集合<img file="FDA0001116769600000023.GIF" wi="302" he="70" />所述预测参数(ξ(k‑1))和所述最终的分配矢量(v<sub>A</sub>(k‑2)),其中,编码的副信息<img file="FDA0001116769600000024.GIF" wi="241" he="72" />被获得;以及‑对所述感知编码的输送信号<img file="FDA0001116769600000025.GIF" wi="253" he="70" />和编码的副信息<img file="FDA0001116769600000026.GIF" wi="269" he="73" />进行复用(808),其中,复用的数据流<img file="FDA0001116769600000027.GIF" wi="270" he="74" />被获得;其中,‑在所述分解(802)步骤中获得的环境HOA分量<img file="FDA0001116769600000028.GIF" wi="354" he="71" />包括所述输入HOA表示(c<sub>n</sub>(k‑1))的在O<sub>MIN</sub>个最低位置的第一HOA系数序列(c<sub>n</sub>(k‑1))以及在其余的较高位置的第二HOA系数序列(c<sub>AMB,n</sub>(k‑1)),所述第二系数序列是所述输入HOA表示和所述主导声音信号的HOA表示之间的残差的HOA表示的一部分;‑前O<sub>MIN</sub>个指数(e<sub>i</sub>(k‑2),i=1,...,O<sub>MIN</sub>)和异常标志(β<sub>i</sub>(k),i=1,...,O<sub>MIN</sub>)在基本层副信息源编码器(320)中被编码,其中,编码的基本层副信息<img file="FDA0001116769600000029.GIF" wi="355" he="78" />被获得,并且其中,O<sub>MIN</sub>=(N<sub>MIN</sub>+1)<sup>2</sup>,O=(N+1)<sup>2</sup>,N<sub>MIN</sub>≤N并且O<sub>MIN</sub>≤I,N<sub>MIN</sub>是预定义整数值;‑前O<sub>MIN</sub>个感知编码的输送信号<img file="FDA0001116769600000031.GIF" wi="539" he="71" />和编码的基本层副信息<img file="FDA0001116769600000032.GIF" wi="358" he="78" />在基本层位流复用器(340)中被复用(809),其中,基本层位流<img file="FDA0001116769600000033.GIF" wi="366" he="76" />被获得;‑其余的I‑O<sub>MIN</sub>个指数(e<sub>i</sub>(k‑2),i=O<sub>MIN</sub>+1,...,I)和异常标志(β<sub>i</sub>(k‑2),i=O<sub>MIN</sub>+1,...,I)、所述第一元组集合<img file="FDA0001116769600000034.GIF" wi="323" he="70" />和第二元组集合<img file="FDA0001116769600000035.GIF" wi="379" he="75" />所述预测参数(ξ(k‑1))以及所述最终的分配矢量(v<sub>A</sub>(k‑2))在增强层副信息编码器(330)中被编码,其中,编码的增强层副信息<img file="FDA0001116769600000036.GIF" wi="310" he="68" />被获得;‑其余的I‑O<sub>MIN</sub>个感知编码的输送信号<img file="FDA0001116769600000037.GIF" wi="609" he="70" />和编码的增强层副信息<img file="FDA0001116769600000038.GIF" wi="334" he="79" />在增强层位流复用器(350)中被复用(810),其中,增强层位流<img file="FDA0001116769600000039.GIF" wi="318" he="71" />被获得;以及‑以信号告知分层模式的使用的模式指示被添加(811)。
地址 荷兰阿姆斯特丹