发明名称 知觉声频信号压缩系统及方法
摘要 本发明提供一知觉声频讯号压缩系统及其方法。如上所述之本发明的设计观点包含使用一双正交修饰过的离散余弦转换转换该讯号成为多个双正交修饰过的离散余弦转换(BMDCT)频率系数;量化该BMDCT频率系数以产生一整数,此整数表示该BMDCT频率系数;以及编码该整数以减少需要表示该BMDCT频率系数的位元数。
申请公布号 TW533405 申请公布日期 2003.05.21
申请号 TW090128560 申请日期 2001.11.19
申请人 威亚达通讯公司 发明人 陈明康;约翰彼得普林森
分类号 G10L19/00 主分类号 G10L19/00
代理机构 代理人 杜汉淮 台北市中山区吉林路二十四号九楼I室
主权项 1.一种编码一讯号的方法,该方法包含下列步骤:使用一双正交修饰(Modified)的离散余弦转换,而将该讯号转换为多个BMDCT频率系数,使用该BMDCT类率系数以产生一组表示该BMDCT频率系数的整数;以及以无耗损编码方式编码该组整数成为代表性的符号,以减少需要表示BMDCT频率系数之位元数。2.如申请专利范围第1项之方法,其中尚包含下列步骤:基于该讯号的特征将该讯号分割成多个不同尺寸的视窗;分析该讯号以决定一组杂讯标的,其中该杂讯可以以实际上透明的方式在该讯号压缩期间导入该讯号;对该BMDCT频率系数进行音响转换以从该BMDCT频率系数中去除所有的冗余及不相关位元;经由调整以不透明方式导入该转换讯号的杂讯量,而调整该BMDCT频率系数量化,使其符合预定讯号的位元速率;以及包封该无耗损编码的整数组,该级距,该转换角度,及视窗的长度到一数据框中以产生一格式化的讯号。3.如申请专利范围第1项之方法,其中该多个BMDCT转换无耗损编码模组的改变为时间的函数,其中转换的长度为产生之BMDCT系数的数目。4.如申请专利范围第3项之方法,其中使用三种不同的BMDCT转换长度。5.如申请专利范围第4项之方法,其中三种不同的BMDCT转换长度为512,256及128。6.如申请专利范围第1项之方法,其中可适性地改变该BMDCT转换长度,其为时间的函数以适应时变声频讯号特性。7.如申请专利范围第6项之方法,其中在现在及未来的声频数据框上执行讯号分析以决定最适化的视窗无耗损编码模组125,因此可以在现在的数据框中使用。8.如如申请专利范围第1项之编码方法,其中在解码器中的BMDCT视窗系数以精确度所减少的位元数表示。9.如申请专利范围第1项之编码方法,其中在设计编码器中BMDCT视窗系数,使得前向转换及反向转换的结合可以执行重建该讯号。10.如申请专利范围第8项之方法,其中该解码器BMDCT视窗系数为:ws'=ws/2nbits其中在此M为转换长度,且nbits为精确度的位元数。11.如申请专利范围第9项之方法,其中定义该编码码器BMDCT视窗为:wa(n)=ws'(n)/c(n),(n)=0…M -1wa(2M-1-n)=wa(n),n=0…M-1其中c(n)=ws'2(n)+ws'2(M+n),n=0…M -112.一种编码具有多个声道之音响输入讯号的方法,该方法包含下列步骤:使用双正交修饰过的离散余弦转换将从多个音响讯号声道中的各声道将一讯号转换成多个BMDCT频率系数;量化该BMDCT频率系数以产生多组整数,该整数表示从各声道产生之BMDCT频率系数;以及以无耗损方式编码该整数组以将需要表示BMDCT频率系数之位元数减少,其中该BMDCT频率系数系为多个声频讯号声道所产生者。13.如申请专利范围第12项之方法,其中将来自多个声道中之各声道的讯号进行转换的步骤包含在该声频讯号的双声道上,执行一22之正交转换:14.如申请专利范围第13项之方法,其中该22正交转换随着时间及频率改变,且表示成一实际上介于0及/2之间的转换角度。15.如申请专利范围第13项之方法,其中经由执行一22的双正交转换而从声频讯号的双声道中去除该冗余项,其中计算该转换角度的方式为得到从BMDCT输出中计算之互相关(cross-correlation)矩阵的固有値(eigenvector)。16.如申请专利范围第12项之方法,其中经由在某一最小频率上加总两声道或相减两声道而从声频讯号的两声道中去除不相关的资讯,因此形成单一声道,且设定在最小频率上之另一声道为0,且包含实际上范围计算的一组角度,其为:=tan-1(er/el)其中ER为右声道(即第二声道)的能量,且ei为左声道(第一声道)的能量。17.如申请专利范围第12项之方法,其中在解码器处,经由执行反向的22正交转换、成重建声频讯号的两个声道,其中该转换为其中为接收的转换角度,其作为来自编码器的侧边资讯。18.如申请专利范围第1项之方法,其中使用均匀量化方式量化该BMDCT系数,使得对于一给定的级距各个量化系数可以表示成Cq=round(c/级距)19.如申请专利范围第18项之方法,其中量化的级距随着频率及时间改变。20.如申请专利范围第18项之方法,其中量化步骤尚包含级距之频率改变,其方式为将频谱分割成一组频带,而在此频带上的量化级距为固定者,且将一或多组的BMDCT频率系数集合为一数据框,其使用为频率之函数的相同级距。21.如申请专利范围第18项之方法,其中量化级距的计算方式为使用psycho一声频模式,其表示可以导入讯号且正好维持非声频型式的杂讯,且计算量化级距190,使得导入的量化杂讯正好为透明的杂讯位阶或低于此位阶。22.如申请专利范围第21项之方法,其中该psycho一声频模式使用音调量测,其计算如下:其中W为用于计算该音调之系数频带的宽度,且e(i)为频谱线的能量,且其中对于所有落在该频带内的BMDCT系数计算该加总値。23.如申请专利范围第21项之方法,其中从需要的杂讯位阶上计算该量化级距,其中该计算步骤为:设定该初始级距,使其最接近(12NT/宽度)1/2,其中NT为杂讯标的,而宽度为需要之杂讯位阶已计算之频带的宽度;使用此级距以计算实际的杂讯,其中该杂讯系在量化该讯号时在频带中导入者,且得到量化讯号及原始讯号之间的差値平方和;如果导入的杂讯大于标的杂讯时,以少量之方式减少级距,直到实际上的杂讯小于标的为止;以及如果该杂讯小于标的时,则以小的增量增加该级距,直到该杂讯正好低于或等于该标的为止。24.如申请专利范围第21项之方法,其中调整用于一级距之量化级距,其方式为对于一数据框调整该标的杂讯的位准,其中需要编码数据框之位元的总数等于或正少于一给定的标的。25.如申请专利范围第24项之方法,其中从一现在数据框的复杂度与先前数据框的平均复杂度之间的关系决定用于一数据框的位元的标的数。26.如申请专利范围第25项之方法,其中对于一数据框之位元的标的数N为tBit(n)=平均位元数.{w+(1-w)数据框复杂度(n)/平均复杂度(n)}其中w大于0.5,且小于1.0,且平均位元为一固定的位元率标的。27.如申请专利范围第26项之方法,其中该数据框复杂度为使用透明杂讯标的需要编码数据框所需要之总位元数所给定,其中使用下列的递回方程式计算平均复杂度;平均复杂度(n)=(1-v)平均复杂度(n-1)+v﹒数据框端度(n)其中v为一大于0且小于0.5的常数。28.如申请专利范围第24项之方法,其中调整一用于一数据框的标的杂讯位阶,其方式为对于透明的杂讯位阶及标的杂讯曲线之间进行线性内插。t杂讯[b]=K[杂讯(b)/能量(b)]rcWeight能量[b]其中K为常数,杂讯[b]为用于频带b的透明杂讯标的,能量[b]为在频带b的声频讯号能量,且rcweight为一常数,其决定标的杂讯曲线的形状,在此情况中,位元的标的数低于使用透明杂讯位阶由编码导入的位元数。29.如申请专利范围第1项之方法,其中组织该量化的BMDCT系数成为包含两数据方块的一数据极,此数据框最多可具有512个系数,或最多可具有256个系数的4个数据方块,或最多可具有128个系数的8个数据方块,其中来自不同数据方块的系数被分群,且以具弹性的方式扫瞄成量化之BMDCT系数的阵列。30.如申请专利范围第1项之方法,其中以无耗损方式编码该量化之BMDCT系数的步骤包含使用固定及可变长度之无耗损编码方法将整数编码成代表性的符号。31.如申请专利范围第30项之方法,其中由无耗损编码方法所产生的各个符号表示成在一给定之数値范围中的一或多个系数。32.如申请专利范围第31项之方法,其中产生一最后的位元串列,其包含重复发生的指数符号,系数符号,及数据方块符号的结束点,直到所有的系数均编码为止,且其中指数符号表示所使用之特定的无耗损编码方法,且定义在该指数及数据方块符号的结束点之间之系数到系数値的对映关系。33.如申请专利范围第32项之方法,其中使用从脉冲编码调变(PCM)编码器中得到之固定长度编码方法产生该系数符号,且其中产生之最大正PCM符号値以表示以数据方块符号的结束点。34.如申请专利范围第32项之方法,其中该可变长度之无耗损编码方法系由Huffman编码器所执行。35.一种形态上用于编码一讯号的装置,包含:一双正交转换模组,配置此模组以使用一双正交修饰过的离散余弦转换,而将一讯号转换成多个BMDCT频率系数;一量化模组,配置此模组以量化该BMDCT频率系数,因此产生一组表示BMDCT频率系数的整数;以及一无耗损编码器模组,配置此模组,以应用无耗损的编码方式编码一组整数,因此使得需要表示BMDCT频率系数的位元数达到最小。36.如申请专利范围第35项之装置,其中尚包含:一讯号分析模组,配置此模组以基于讯号的特征将该讯号分割成多个不同的视窗型式,且分析该讯号以决定一组杂讯标的,其中该杂讯以透明的方式导入该讯号中以压缩该讯号;一音响转换模组,配置此模组以对于该BMDCT频率系数进行音响转换,因比可以从该BMDCT频率系数中去除所有冗余及不相关的位元;一速率控制模组,配置此模组以使用从讯号分析模组中接收的杂讯标的,且决定需要以透明方式将杂讯配置到BMDCT频率系数的级距,以符合一需要的每数据框之位元数;以及一数据框包封模组,配置此模组以包封该无耗损编码的整数値,多个级距,多个转换角度,及多个视窗无耗损编码模组成为一数据框,以产生格式化的讯号。37.如申请专利范围第35项之装置,其中该双正交转换模组对于不同的讯号特征提供多个不同的分析解析度状态。38.如申请专利范围第37项之装置,其中该双正交转换模组在个样本边界上的多个不同的分析解析度状态上移转。39.如申请专利范围第37项之装置,其中该多个不同的分析解析度状态包含长状态,一中状态及一短状态。40.如申请专利范围第39项之装置,其中该长状态包含512个讯号频率系数,该中状态包含256个讯号频率系数,且短状态包含128个讯号频率系数。41.如申请专利范围第39项之装置,其中该双正交转换模组可以在该长状态及短状态之间进行直接迁移,及该短状态及长状态之间进行直接迁移。42.如申请专利范围第40项之装置,其中将512个讯号频率系数集合成一次数据框。43.如申请专利范围第42项之装置,其中每一数据框中有两个次数据框。44.如申请专利范围第35项之装置,其中量化模组使用脉波编码调变量化该BMDCT频率系数。45.如申请专利范围第35项之装置,其中对于一给定的级距値,使用下列方程式以整数表示该量化的BMDCT频率系数:cq=round(c/级距)。46.如申请专利范围第45项之装置,其中该级距値随后将改变。47.如申请专利范围第45项之装置,其中在一频带内固定该级距値。48.如申请专利范围第45项之装置,其中对于一特定的频带选择一级距値,使得导入级距的杂讯符合由速率控制模组所指定的杂讯标的。49.如申请专利范围第35项之装置,其中该无耗损编码器模组使用可变长度Huffman编码及脉波编码调变,以一可适性方式,而使得需要表示BMDCT频率系数之位元数码最小者。50.如申请专利范围第43项之装置,其中以无耗损的方式将一数据框的两个次数据框编码在一起。51.如申请专利范围第36项之装置,其中该不同视窗的型式可以为一长视窗,一中视窗及一短视窗。52.如申请专利范围第36项之装置,其中该音响转换码一22的正交转换。53.如申请专利范围第36项之装置,其中速率控制模组控制为该量化模组所使用的量化级距。54.如申请专利范围第36项之装置,其中该速率控制模组基于串列的平均复杂度及现在数据框的复杂度,分配多个位元。55.如申请专利范围第36项之装置,其中该速率控制模组允许对位元依据下列方程式进行相当具弹性的分配于单一数据框中,该方程式为:tbits=平均位元(0.75+0.25数据框复杂度/平均复杂度),在此平均位元为固定位元速率标的。56.如申请专利范围第54项之装置,其中量测该复杂度作为以透明方式编码该数据框的位元数。57.一种用于解码一格式化讯号的方法,该方法包含下列步骤:解码该编码的量化BMDCT频率系数,以重建表示一讯号之BMDCT频率系数的量化之整数组;反向量化该量化的整数以产生该讯号的BMDCT频率系数;以及使用一双正交修饰过的离散余弦转换模组复制该讯号,以转换该讯号的BMDCT频率系数。58.如申请专利范围第57项之解码方法,其中在解码器中的BMDCT视窗系数以数目减少之精确位元表示,且配置在该编码器中的BMDCT视窗系数,使得前向转换及反转换的结合实际上可以执行重建该讯号。59.如申请专利范围第57项之解码方法,其中在解码器中的BMDCT视窗系数以数目减少之精确位元表示。60.如申请专利范围第57项之方法,其中尚包含下列步骤:分开该格式化的位元串列成为侧边资讯及量化的BMDCT频率系数;以及将来自一对声道的BMDCT频率系数及传送的侧边资讯进行反音响转换,以产生该讯号的BMDCT频率系数。61.一种用于解码一格式化信号的装置,该装置包含:一无耗损解码器模组,配置此模组以应用无耗损的方式解码该格式化信号,因此可以重建表示一讯号之BMDCT频率系数的一组量化整数;一反量化模组,配置此模组以反向量化该量化的整数组,因比产生该讯号的BMDCT频率系数;以及一反双正交修饰之离散余弦转换模组,配置此模组以反向转换该BMDCT频率系数,以复制该讯号。62.如申请专利范围第61项之装置,其中,尚包含:一数据框解包封模组,配置此结果以将格式化的位元串列分为侧边资讯及量化的BMDCT频率系数;以及一音响转换器,配置此转换器以从一对声道中以反向音响转换该BMDCT频率系数,且转换该侧边资讯以产生该讯号的BMDCT频率系数。63.一种用于编码资讯以产生一格式化信号且解码该格式化信号的方法,该方法包含下列步骤:使用一双正交修饰的离散余弦转换以转换该讯号成为多个BMDCT频率系数;量化该BMDCT频率系数以产生一整数组,此整数组表示BMDCT频率系数;编码该整数组,以减少需要表示该BMDCT频率系数的位元位;解码该编码之量化BMDCT频率系数以重建该量化的整数,其中该整数表示一讯号的BMDCT频率系数;反向量化该量化的整数,以产生该讯号的BMDCT频率系数;以及使用一双正交修饰过的离散余弦转换模组将该讯号的BMDCT频率系数进行反向转换以复制该讯号。64.如申请专利范围第62项之方法,其中尚包含下列步骤:基于该讯号的特性,将该讯号分割成多个不同的视窗长度;分析该讯号,以决定一组杂讯标的,其中以透明的方式,将该杂讯导入以压缩该讯号;音响转换该BMDCT频率系数以从该BMDCT频率系数中去除所有的兀及不相关位元;经由调整透明导入该转换讯号的杂讯量,以符合一预定的讯号位元速率,因此调整该BMDCT频率系数的量化;包封该无耗损编码的整数组,级距,转换角度及视窗长度于一数据框中,以产生一格式化信号;以及将来自一对声道中BMDCT频率系数进行音响转换,及转换该转换的侧边资讯,以产生该讯号的BMDCT频率系数。65.一种用于编码讯号资讯以产生格式化信号且解码该格式化信号的系统,该系统包含:一双正交转换模组,配置此模组以使用一双正交修饰过的离散余弦转换,而将一讯号转换成多个BMDCT频率系数;一量化模组,配置此模组以量化该BMDCT频率系数,因此产生一组表示BMDCT频率系数的整数;以及一无耗损编码器模组,配置此模组,以应用无耗损的编码方式编码一组整数,因此使得需要表示BMDCT频率系数的位元数达到最小一无耗损解码器模组,配置此模组以无耗损的方式解码该格式化信号,以重建表示一讯号之BMDCT频率系数的量化整数组;一反向量化模组,配置此模组以反向整数组该量化的整数组,因此产生该讯号的BMDCT频率系数;以及一反向双正交修饰过的离散余弦转换模组,配置此模组以将BMDCT频率系数方向转换而复制该讯号。66.如申请专利范围第64项之系统,该系统尚包含:一讯号分析模组,配置此模组以基于讯号的特征将该讯号分割成多个不同的视窗型式,且分析该讯号以决定一组杂讯标的,其中该杂讯以透明的方式导入该讯号中以压缩该讯号;一音响转换模组,配置此模组以对于该BMDCT频率系数进行音响转换,因此可以从该BMDCT频率系数中去除所有冗余及不相关的位元;一速率控制模组,配置此模组以使用从讯号分析模组中接收的杂讯标的,且决定需要以透明方式将杂讯配置到BMDCT频率系数的级距,以符合一需要的每数据框之位元数;以及一数据框包封模组,配置此模组以包封该无耗损编码的整数组,多个级距,多个转换角度,及多个视窗无耗损编码模组成为一数据框,以产生格式化的讯号。一数据框解包封模组,配置此模组以将一格式化的位元串列分成侧边资讯及量化的BMDCT频率系数;以及一音响转换器,配置此转换器以将来自一对声道的BMDCT频率系数及转换的侧边资讯进行反向音响转换,因此产生该讯号的BMDCT频率系数。图式简单说明:图1为依据本发明之知觉声频讯号压缩系统的数据方块图。图2示在三种不同视窗型式中之不同的可能迁移状态的状态图。图3示一长状态至一短状态迁移的例子。图4示从一短状态到一长状态迁移的例子。图5示讯号分析程序之一例子,系用于分析将来临的次数据框,以依据本发明对于各BMDCT转换,决定最佳的视窗型式。图6的流程图详细说明依据本发明中用于选择一视窗型式的方法。图7系用于说明长,中,短视窗型式的数据方块结构。图8示依据本发明之用于长BMDCT于数据框之系数符号的不同扫瞄机率。图9示依据本发明之用于中BMDCT次数据框之系数符号的不同扫瞄机率。图10示依据本发明之用于短BMDCT次数据框之系数符号的不同扫瞄机率。图11示依据本发明之系数符号阵列的最后表示法。
地址 美国