发明名称 声音物件编码器、声音物件编码方法、声音合成器、声音合成方法、电脑可读取的储存媒体以及电脑程式
摘要
申请公布号 TWI347590 申请公布日期 2011.08.21
申请号 TW096137940 申请日期 2007.10.11
申请人 寇丁科技股份有限公司 发明人 裘纳斯英格德嘉德;海寇普尔恩哈根;巴巴拉瑞屈;拉斯威勒摩斯
分类号 G10L19/00 主分类号 G10L19/00
代理机构 代理人 何金涂 台北市大安区敦化南路2段77号8楼;王彦评 台北市大安区敦化南路2段77号8楼
主权项 一种声音物件编码器(audio object coder),系利用复数个声音物件以产生已编码的声音物件,其中该复数个声音物件系包含以具有特定的非零相关性的两个声音物件来表示的立体声物件,该编码器包括:下降混合资讯产生器(96)(downmix information generator),用以产生下降混合资讯,该下降混合资讯指示将该复数个声音物件分配给至少两个下降混合声道;物件参数产生器(94)(object parameter generator),用以产生用于该等声音物件的物件参数;以及输出介面(98)(output interface),利用该下降混合资讯以及该等物件参数以产生该已编码的声音物件信号。如申请专利范围第1项之声音物件编码器,其中进一步包含:降混器(92)(downmixer),用以下降混合该复数个声音物件给复数个下降混合声道,其中该等声音物件的个数系大于该等下降混合声道的个数,并且其中该降混器系与该下降混合资讯产生器耦接,以便如该下降混合资讯所指示来实行对于该复数个下降混合声道之该复数个声音物件的分配。如申请专利范围第2项之声音物件编码器,其中该输出介面(98)额外地使用该复数个下降混合声道以产生该已编码的声音信号。如申请专利范围第1项之声音物件编码器,其中该物件参数产生器(94)系以第一时间与频率解析度来产生该等物件参数,并且该下降混合资讯产生器(96)系以第二时间与频率解析度来产生该下降混合资讯,该第二时间与频率解析度系小于该第一时间与频率解析度。如申请专利范围第1项之声音物件编码器,其中该下降混合资讯产生器(96)系以该下降混合资讯在该等声音物件的整个频带中为相等的方式来产生该下降混合资讯。如申请专利范围第1项之声音物件编码器,其中该下降混合资讯产生器(96)系以该下降混合资讯表示定义如下之下降混合矩阵的方式来产生该下降混合资讯:X=DS其中S系一矩阵,表示该等声音物件,且具有与该等声音物件的个数相同的行列数,D系该下降混合矩阵,以及X系一矩阵,代表该复数个下降混合声道,且具有与该等下降混合声道的个数相同的行列数。如申请专利范围第1项之声音物件编码器,其中该下降混合资讯产生器(96)系计算该下降混合资讯,以便该下降混合资讯指示:那一个声音物件系完整地或者部分地包含于该复数个下降混合声道之一个以上的声道之中,以及何时声音物件系包含于一个以上的下降混合声道中,与该等声音物件之一部份有关的资讯包含在该等一个以上的下降混合声道的一个下降混合声道之中。如申请专利范围第7项之声音物件编码器,其中该与一部份有关之资讯系小于1且大于0的因子。如申请专利范围第2项之声音物件编码器,其中该降混器(92)在该至少两个下降混合声道中包含背景音乐的立体声表示,并且以事先定义的比率将一个声轨引入该至少两个下降混合声道中。如申请专利范围第2项之声音物件编码器,其中该降混器(92)对于要被输入至下降混合声道的信号,如该下降混合资讯所指示,执行采样相(sample-wise)加法。如申请专利范围第1项之声音物件编码器,其中该输出介面(98)在产生该已编码的声音物件信号之前,执行该下降混合资讯以及该等物件参数的资料压缩。如申请专利范围第1项之声音物件编码器,其中该下降混合资讯产生器(96)产生功率资讯以及相关性资讯,指示该至少两个下降混合声道的功率特征以及相关性特征。如申请专利范围第1项之声音物件编码器,其中该下降混合资讯产生器(96)产生群组资讯,指示形成该立体声物件的该两个声音物件。如申请专利范围第1项之声音物件编码器,其中该物件参数产生器(94)产生用于该等声音物件的物件预测参数,该等物件预测参数系利用以下方式算出:由该等物件预测参数或来源物件所控制的该来源物件所使用的下降混合声道的加权相加,可得到该来源物件的近似值。如申请专利范围第14项之声音物件编码器,其中按频带产生该等物件预测参数,且其中该等声音物件系涵盖复数个频带。如申请专利范围第14项之声音物件编码器,其中该等声音物件的个数等于N,该等下降混合声道的个数等于K,以及由该物件参数产生器(94)算出的物件预测参数的个数等于或者小于N.K。如申请专利范围第16项之声音物件编码器,其中该物件参数产生器(94)计算至多K.(N-K)个物件预测参数。一种声音物件编码方法,系利用复数个声音物件以产生已编码的声音物件,其中该复数个声音物件系包含以具有特定的非零相关性的两个声音物件来表示的立体声物件,该编码方法包括:产生下降混合资讯,该下降混合资讯指示将该复数个声音物件分配给至少两个下降混合声道;产生用于该等声音物件的物件参数;以及利用该下降混合资讯以及该等物件参数以产生该已编码的声音物件信号。一种声音合成器,系利用已编码的声音物件信号以产生输出资料,该声音合成器包括:输出资料合成器(100),用以产生该输出资料,该输出资料系可用于提供代表复数个声音物件的预先定义的声音输出配置之复数个输出声道,其中该复数个声音物件系包含以具有特定的非零相关性的两个声音物件来表示的立体声物件,该输出资料合成器接收物件参数(95)作为输入,其中该等物件参数(95)包含该复数个声音物件之物件能量的近似值、与立体物件之相关资料,且该输出资料合成器使用指示将该复数个声音物件分配给至少两个下降混合声道之下降混合资讯(97),以及用于该等声音物件之声音物件参数(95)。如申请专利范围第19项之声音合成器,其中该输出资料合成器(100)系额外地利用在该声音输出配置中,该等声音物件预期的定位,以将该等声音物件参数转码成用于该预先定义的声音输出配置之复数个空间参数。如申请专利范围第19项之声音合成器,其中该输出资料合成器(100)系使用从该等声音物件的该预期的定位推导出的转换矩阵,将复数个下降混合声道转换成用于该预先定义的声音输出配置之该立体声降混。如申请专利范围第21项之声音合成器,其中该输出资料合成器(100)系使用该下降混合资讯以决定该转换矩阵,其中该转换矩阵系经过计算,使得当包含在表示立体声平面的第一个一半的第一下降混合声道的声音物件将在该立体声平面的该第二个一半中播放时,该等下降混合声道之中的至少一部份被交换。如申请专利范围第20项之声音合成器,其中进一步包含声道提供器(104)(channel renderer),系使用该等空间参数以及该等至少两个下降混合声道或者该等已经转换过的下降混合声道,以提供该预先定义的声音输出配置的复数个声音输出声道。如申请专利范围第19项之声音合成器,其中该输出资料合成器(100)系额外使用该至少两个下降混合声道,以输出该预先定义的声音输出配置的该等输出声道。如申请专利范围第19项之声音合成器,其中复数个空间参数包含用于2至3(Two-To-Three)的上升混合的多数参数的该第一群组,以及用于3-2-6(Three-Two-Six)上升混合的复数个能量参数的第二群组,以及其中该输出资料合成器(100)系使用转列矩阵(rendering matrix)以计算该2至3(Two-To-Three)预测资料矩阵的复数个预测参数,该转列矩阵系由该等声音物件的预期的定位、描述将该等输出声道下降混合成由假设的2至3(Two-To-Three)上升混合程序所产生的三个声道的部分下降混合矩阵以及该部分下降混合矩阵所决定。如申请专利范围第25项之声音合成器,其中该输出资料合成器(100)系计算实际的降混权重,该降混权重系用于该部分降混矩阵,使得两个声道的加权和的能量,在不超过依限制因子的范围之内系等于该等声道的能量。如申请专利范围第26项之声音合成器,其中用于该部分降混矩阵的该等降混权重系由下列方程式决定:@sIMGTIF!d10019.TIF@eIMG!其中wp系为降混权重,p系整数的索引变数,fj,i系矩阵元素,其表示该预先定义的输出配置的该等输出声道的协方差矩阵的近似值的能量矩阵。如申请专利范围第25项之声音合成器,其中该输出资料合成器(100)系藉由解算线性方程式系统,计算该2至3预测矩阵的复数个不同的系数。如申请专利范围第25项之声音合成器,其中该输出资料合成器(100)系解算线性方程式系统,该系统依据:C3(DED*)=A3ED*,其中C3系2至3(Two-To-Three)预测矩阵,D系从该下降混合资讯推导得到的降混矩阵,E系从该等声音源物件推导得到的能量矩阵,以及A3系该简化的下降混合矩阵,并且其中符号“*”系表示共轭复数运算。如申请专利范围第25项之声音合成器,其中用于该2至3(Two-To-Three)上升混合的该等预测参数系从该预测矩阵的参数化推导而得,使得该预测矩阵系仅使用两个参数来定义,以及其中该输出资料合成器(100)系预先处理该等至少两个下降混合声道,使得该预先处理以及参数化的预测矩阵的效果系对应于预期的上升混合矩阵。如申请专利范围第30项之声音合成器,其中该预测矩阵的参数化如下:@sIMGTIF!d10020.TIF@eIMG!其中索引TTT系为该参数化预测矩阵,以及其中α、β以及γ系因子。如申请专利范围第19项之声音合成器,其中下降混合转换矩阵G系计算如下:G=DTTTC3,其中C3系2至3(Two-To-Three)预测矩阵,其中DTTT与CTTT系等于I,其中I系2乘2的单位矩阵,并且其中CTTT系依据:@sIMGTIF!d10021.TIF@eIMG!其中α、β以及γ系为常数因子。如申请专利范围第32项之声音合成器,其中用于该2至3(Two-To-Three)上升混合的该等预测参数系决定为α与β,其中γ系设定为1。如申请专利范围第25项之声音合成器,其中该输出资料合成器(100)系使用能量矩阵F,以计算用于该3-2-6上升混合的该等能量参数,能量矩阵依据:@sIMGTIF!d10022.TIF@eIMG!其中A系该转列矩阵,E系从该等声音源物件推导得到的能量矩阵,Y系输出声道矩阵,以及符号“*”系表示该共轭复数运算。如申请专利范围第34项之声音合成器,其中该输出资料合成器(100)系藉由组合该能量矩阵的复数个元素,计算该等能量参数。如申请专利范围第35项之声音合成器,其中该输出资料合成器(100)系计算该等能量参数,依据下列方程式:@sIMGTIF!d10023.TIF@eIMG!其中φ系一绝对值φ(z)=|z|,或者实数值运算子φ(z)=Re{z},其中CLD0系第一声道位准差(channel level difference)能量参数,其中CLD1系第二声道位准差能量参数,其中CLD2系第三声道位准差能量参数,其中ICC1系第一声道间同调性(inter=channel coherence)能量参数,以及ICC2系第二声道间同调性能量参数,且其中fij系能量矩阵F的元素,其在此矩阵的i,j位置上。如申请专利范围第25项之声音合成器,其中复数个参数的该第一群组包含复数个能量参数,以及其中该输出资料合成器(100)系藉由组合该能量矩阵F的元素,推导该等能量参数。如申请专利范围第37项之声音合成器,其中该等能量参数系依据下列方程式进行推导:@sIMGTIF!d10024.TIF@eIMG!其中@sIMGCHAR!d10071.TIF@eIMG!系该第一群组的第一能量参数,以及其中@sIMGCHAR!d10070.TIF@eIMG!系该第一参数群组的第二能量参数。如申请专利范围第37或38项之声音合成器,其中该输出资料合成器系计算用于加权该等下降混合声道的复数个权重因子,该等权重因子系用于控制该空间解码器的任意的下降混合增益因子。如申请专利范围第39项之声音合成器,其中该输出资料合成器(100)系计算该等权重因子,依据:Z=DED*,W=D26ED*26,@sIMGTIF!d10025.TIF@eIMG!其中D系该下降混合矩阵,E系从该等声音源物件导出的能量矩阵,其中W系中间矩阵,其中D26系该部分下降混合矩阵,用以将该预先决定的输出配置,从6个声道下降混合至2个声道,且其中G系转换矩阵,包含该空间解码器的任意下降混合增益因子。如申请专利范围第25项之声音合成器,其中该等物件参数系物件预测参数,并且其中该输出资料合成器系预先计算能量矩阵,依据该等物件预测参数、该下降混合资讯以及对应于该等下降混合声道的该能量资讯。如申请专利范围第41项之声音合成器,其中该输出资料合成器系计算该能量矩阵,其依据:E=CZC*,其中E系该能量矩阵,C系该预测参数矩阵,以及Z系该等至少两个下降混合声道的协方差矩阵。如申请专利范围第19项之声音合成器,其中该输出资料合成器(100)系藉由计算参数化的立体声转列矩阵及相关的参数化立体声转列矩阵以及转换矩阵,以产生立体声输出配置的两个立体声道。如申请专利范围第43项之声音合成器,其中该输出资料合成器(100)系计算该转换矩阵,依据:G=A2.C,其中G系转换矩阵,A2系部分转列矩阵,以及C系预测参数矩阵。如申请专利范围第43项之声音合成器,其中该输出资料合成器(100)系计算该转换矩阵,依据:G(DED*)=A2ED*,其中G系从该等音轨的声音源导出的能量矩阵,D系从该下降混合资讯导出的下降混合矩阵,A2系简化的转列矩阵,以及“*”系表示共轭复数运算。如申请专利范围第43项之声音合成器,其中该参数化的立体声转列矩阵A2系以下列方式决定:@sIMGTIF!d10026.TIF@eIMG!其中μ、v以及@sIMGCHAR!d10072.TIF@eIMG!系实数值参数,将依据一个以上声音来源物件的位置以及音量进行设定。一种声音合成方法,系利用已编码的声音物件信号以产生输出资料,该已编码的声音物件信号包含用于复数个声音物件之物件参数及下降混合资讯,该方法包括:接收该等物件参数(95),其中该等物件参数(95)包含该复数个声音物件之物件能量的近似值、与用于立体物件之相关资料,产生该输出资料,该输出资料系可用于创建代表复数该等声音物件的预先定义的声音输出配置之多数输出声道,该输出资料合成器系使用指示将该复数个声音物件分成至少两个下降混合声道的分配之下降混合资讯(97),以及用于该等声音物件之复数个声音物件参数(95)。一种电脑可读取的储存媒体,其存有已编码的声音物件信号,该已编码的声音物件信号包含下降混合资讯,指示将复数个声音物件分成至少两个下降混合声道以及复数个物件参数的分配,该已编码的声音物件信号另包含物件参数(95),其中该等物件参数(95)包含该复数个声音物件之物件能量的近似值、与用于立体物件之相关资料,该复数个声音物件系包含以具有特定的非零相关性的两个声音物件来表示的立体声物件,该等物件参数系使得可以使用该等物件参数以及该至少两个下降混合声道以重建该等声音物件。一种电脑程式,当该程式在电脑上执行时,可用以实现如专利申请范围第18或47项的方法。
地址 瑞典