发明名称 音频编码器、音频解码器、具有动态可变扭曲特性之音频处理器、存有已编码音频信号之储存媒体、音频编码方法、音频解码方法、音频处理方法、以及执行此等方法之程式
摘要
申请公布号 申请公布日期 2011.09.11
申请号 TW096122715 申请日期 2007.06.23
申请人 佛劳恩霍夫尔公司 发明人 侏根赫瑞;柏哈德葛利尔;马库斯穆楚斯;史蒂芬拜尔;巫立奇克拉墨;詹斯希史费德;史蒂芬瓦布尼克;杰拉尔德舒勒
分类号 G10L19/00;G10L21/00 主分类号 G10L19/00
代理机构 代理人 何金涂 台北市大安区敦化南路2段77号8楼
主权项 一种用以编码音频信号之音频编码器,包含:前置滤波器,用以产生前置滤波音频信号,此前置滤波器具有可变的扭曲(warping)特性,可响应时变控制信号来控制此扭曲特性,此控制信号表示低的或没有扭曲特性、或比较高的扭曲特性;控制器,用以提供该时变控制信号,此时变控制信号取决于音频信号;及可控(controllable)编码处理器,用以处理该前置滤波音频信号以得到已编码音频信号,其中该编码处理器依据适用在特定信号态样之第一编码演算法,或依据适用以编码一般音频信号之不同之第二编码演算法,而适用以处理该前置滤波音频信号。如申请专利范围第1项之音频编码器,其中该编码处理器系适用以使用语音编码演算法之至少一部分作为该第一编码演算法。如申请专利范围第1项之音频编码器,其中该编码处理器适用以使用剩余/激发编码演算法作为该第一编码演算法之一部分,该剩余/激发编码演算法包含激发码线性预测(CELP)编码演算法、多脉冲激发(MPE)编码演算法、或规则脉冲激发(RPE)编码演算法。如申请专利范围第1项之音频编码器,其中该编码处理器系适用以使用滤波器组架构、滤波器组架构、或时域架构之编码演算法作为该第二编码演算法。如申请专利范围第1项之音频编码器,其中又包含心理听觉模组,用以于遮蔽临界上提供资讯;及其中该前置滤波器系用以根据该遮蔽临界来执行一滤波器操作,致使在前置滤波音频信号中,相对于心理听觉上较不重要部分,放大心理听觉上较重要部分。如申请专利范围第5项之音频编码器,其中该前置滤波器为一具有可控扭曲因子之线性滤波器,此可控扭曲因子系由该时变控制信号决定,及其中基于该遮蔽临界的分析来决定滤波器系数。如申请专利范围第1项之音频编码器,其中该第一编码演算法包含剩余或激发编解码步骤,并且该不同之第二编码演算法包含一般音频编码步骤。如申请专利范围第1项之音频编码器,其中该编码处理器包含:第一编码核心,以应用该第一编码演算法至该音频信号;第二编码核心,以应用该第二编码演算法至该音频信号;其中二个编码核心均具有连接至该前置滤波器之输出的共同输入,其中二个编码核心均具有各自的输出,其中该音频编码器更包含输出级,用以输出该编码信号,及其中该控制器系用以仅将针对时间部为有效之由该控制器所指示的编码核心之输出连接至该输出级。如申请专利范围第1项之音频编码器,其中该编码处理器包含:第一编码核心,以应用该第一编码演算法至该音频信号;第二编码核心,以应用该第二编码演算法至该音频信号;其中二个编码核心均具有连接至该前置滤波器之输出的共同输入,其中二个编码均核心具有各自的输出,及其中该控制器系操作以启动由编码模式指示所选择之编码核心,及关闭(deactivate)未被编码模式指示所选择之编码核心,或针对音频信号之相同时间部之不同部分启动二个编码核心。如申请专利范围第1项之音频编码器,其中又包含输出级,用以将时变控制信号或藉由量化或编码从时变控制信号取出之信号,作为从属资讯而输出至编码信号。如申请专利范围第6项之音频编码器,其中又包含输出级,用以将遮蔽临界上的资讯作为从属资讯而输出至已编码音频信号。如申请专利范围第6项之音频编码器,其中当应用该不同之第二编码演算法时,该编码处理器可操作使用具有量化特性之量化器,引入具有平坦频谱分布之量化杂讯,以量化该前置滤波音频信号。如申请专利范围第12项之音频编码器,其中当应用该不同之第二编码演算法时,该编码处理器可操作以量化前置滤波时域取样、或子频带取样、频率系数或从该前置滤波音频信号取得之剩余取样。如申请专利范围第1项之音频编码器,其中相较于前置滤波器之低扭曲特性或无扭曲特性,该控制器可操作以提供时变控制信号,致使对于前置滤波器之比较高的扭曲特性,扭曲操作在低频范围中增加频率解析度及在高频范围中减少频率解析度。如申请专利范围第1项之音频编码器,其中该控制器包含音频信号分析器,用以分析音频信号以决定时变控制信号。如申请专利范围第1项之音频编码器,其中该控制器可操作以产生时变控制信号,而此时变控制信号除了具有指示没有或仅具低扭曲特性之第一极端状态(extreme state)外,并具有指示最大扭曲特性之第二极端状态,零个或一个或更多个指示该等极端状态之间的扭曲特性之中间状态。如申请专利范围第1项之音频编码器,其中更包含有一内插器(interpolator),其中此内插器可操作以控制该前置滤波器,致使于具有至少二个时域取样之衰退时间周期上,藉由时变控制信号所发出之二个扭曲状态间的信号衰退扭曲特性。如申请专利范围第17项之音频编码器,其中该衰退时间周期包含至少50个时域态样,此时域态样系处于由没有或低的扭曲导致之滤波器特性与由比较高的扭曲导致之滤波器特性之间,导致扭曲频率解析度类似于BARK或ERB比例(scale)。如申请专利范围第17项之音频编码器,其中该内插器可操作以使用可导致扭曲特性介于二扭曲特性之间的扭曲因子,而该二扭曲特性系藉由衰退时间周期中的时变控制信号表示。如申请专利范围第1项之音频编码器,其中该前置滤波器为一具有扭曲FIR或扭曲IIR结构之数位滤波器,该结构包含多个延迟元件,延迟元件系形成为该延迟元件具有一阶或更高阶之全通滤波器特性。如申请专利范围第20项之音频编码器,其中该全通滤波器特性系基于下列滤波器特性:(i>z/i>-1-i>λ/i>)/(1-i>λz/i>-1),其中i>z/i>-1表示离散时域中之延迟,并且其中i>λ/i>为针对扭曲因子等级接近「1」时表示较剧烈的扭曲特性之扭曲因子且针对扭曲因子等级接近「0」时表示较小之扭曲特性之扭曲因子。如申请专利范围第20项之音频编码器,其中该FIR或IIR结构又包含权重元件,每一权重元件具有相关之权重因子,其中藉由前置滤波器之滤波器系数来决定该权重因子,此滤波器系数包含LPC分析或合成滤波器系数、或遮蔽临界所决定之分析或合成滤波器系数。如申请专利范围第20项之音频编码器,其中该前置滤波器具有介于6到30之间的滤波器阶数。如申请专利范围第1项之音频编码器,其中该编码处理器为适用以藉由控制器来进行控制,致使使用比较高的扭曲特性来滤波之音频信号部系使用该第二编码演算法来进行处理,以得到编码信号,并且使用低的或没有扭曲特性来滤波之音频信号系使用第一编码演算法来进行处理。一种用以解码已编码音频信号之音频解码器,该已编码音频信号具有依据适用于特定信号态样之第一编码演算法而编码之第一部,以及具有依据适用以编码一般音频信号之不同的第二编码演算法而编码之第二部,包含:侦测器,用以侦测以该第一部或该第二部为基础之编码或解码演算法;解码处理器,其响应该侦测器,使用对应于该第一编码演算法之第一解码演算法来解码该第一部,以得到第一解码时间部,并使用对应于该第二编码演算法之第二解码演算法来解码该第二部,以得到第二解码时间部;以及具有可变扭曲特性之后端滤波器,于具有低的或没有扭曲特性之第一状态与具有比较高的扭曲特性之第二状态之间是可控制的。如申请专利范围第25项之音频解码器,其中可设定该后端滤波器,使得后端滤波期间之扭曲特性类似于在扭曲强度上之10%的容忍范围中的前置滤波期间所使用之扭曲特性。如申请专利范围第25项之音频解码器,其中该已编码音频信号包含一解码模式指示器或扭曲因子资讯,其中该侦测器可操作以从已编码音频信号之解码模式或扭曲因子上撷取资讯,及其中该解码处理器或后端滤波器可操作以使用该撷取资讯而被控制。如申请专利范围第27项之音频解码器,其中从该撷取资讯取得并用以控制该后端滤波器之扭曲因子具有一正符号。如申请专利范围第25项之音频解码器,其中该已编码音频信号又包含取决于以编码信号为基础之原始信号之遮蔽临界的滤波器系数上的资讯,及其中该侦测器可操作以从已编码音频信号撷取滤波器系数上的资讯,及其中该后端滤波器适用以基于该滤波器系数上之撷取资讯而被控制,致使后端滤波信号比进行前置滤波前之信号更近似于原始信号。如申请专利范围第25项之音频解码器,其中该解码处理器适用以使用一语音解码演算法作为该第一解码演算法。如申请专利范围第25项之音频解码器,其中该解码处理器适用以使用剩余/激发解码演算法作为该第一解码演算法。如申请专利范围第25项之音频解码器,其中包含剩余/激发解码演算法作为该第一解码演算法之一部份,该剩余/激发解码演算法包含激发码线性预测(CELP)解码演算法、多脉冲激发(MPE)解码演算法、或规则脉冲激发(RPE)解码演算法。如申请专利范围第25项之音频解码器,其中该解码处理器系适用以使用以滤波器组架构或以转换架构或时域架构之解码演算法作为第二解码演算法。如申请专利范围第25项之音频解码器,其中该解码处理器包含第一解码核心,以应用该第一解码演算法至该已编码音频信号;第二解码核心,以应用该第二解码演算法至该已编码音频信号;其中二个解码核心均具有一输出,每一输出系连接至连结器,此连结器具有连接至该后端滤波器之输入的输出,其中该等解码核心为可控制的,致使仅藉由选择解码演算法而输出之解码时间部系转向至该连结器,并且藉由不同解码核心及用以结合该等不同部分之解码表现的该连结器,来处理该后端滤波器或音频信号之相同时间部的不同部分。如申请专利范围第25项之音频解码器,其中当应用该第二解码演算法时,该解码处理器可操作以解量化(dequantize)音频信号,其中该音频信号系已使用具有引入一具有平坦频谱分布之量化杂讯的量化特性之量化器而被量化的音频信号。如申请专利范围第25项之音频解码器,其中当应用该第二解码演算法时,该解码处理器可操作以解量化已量化之时域取样、已量化之子频带取样、已量化之频率系数或已量化之剩余取样。如申请专利范围第25项之音频解码器,其中该侦测器可操作以提供时变后端滤波器控制信号,致使相较于具有低的或没有扭曲特性之后端滤波器之滤波器输出信号,扭曲滤波器输出信号在该后端滤波器之比较高的扭曲特性方面,于高频范围具有减少的频率解析度并且于低频范围具有增加的频率解析度。如申请专利范围第25项之音频解码器,其中又包含一内插器,用以控制该后端滤波器,致使扭曲特性在具有至少二个时域态样之衰退时间周期上,于二个扭曲状态间衰退。如申请专利范围第25项之音频解码器,其中该后端滤波器为具有扭曲FIR或扭曲IIR结构之数位滤波器,该结构包含多个延迟元件,该延迟元件系形成为此延迟元件具有一阶或更高阶之全通滤波器特性。如申请专利范围第39项之音频解码器,其中该全通滤波器特性基于下列滤波器特性:(i>z/i>-1-i>λ/i>)/(1-i>λz/i>-1),其中i>z/i>-1表示离散时域中之延迟,并且其中i>λ/i>为针对扭曲因子等级接近「1」时表示较剧烈的扭曲特性之扭曲因子及针对扭曲因子等级接近「0」时表示较小之扭曲特性之扭曲因子。如申请专利范围第39项之音频解码器,其中该扭曲FIR或扭曲IIR结构更包含加权元件,每一加权元件具有相关之加权因子,其中藉由前置滤波器之滤波器系数来决定该加权因子,此滤波器系数包含LPC分析或合成滤波器系数、或遮蔽临界所决定之分析或合成滤波器系数。如申请专利范围第25项之音频解码器,其中该后端滤波器系被控制成使用低的或没有扭曲特性来对第一解码时间部进行滤波,并且使用比较高的扭曲特性来对第二解码时间部进行滤波。一种存有已编码音频信号之储存媒体,该已编码音频信号具有依据适用于特定信号态样之第一编码演算法而被编码之第一时间部,及具有依据适用以编码一般音频信号之不同的第二编码演算法而被编码之第二时间部,该已编码音频信号更包含一扭曲因子作为从属资讯,且该扭曲因子系指示基于该已编码音频信号之第一或第二部的扭曲强度。一种编码音频信号之方法,包含:产生前置滤波音频信号,该前置滤波器具有可变扭曲特性,可响应时变控制信号来控制该扭曲特性,该控制信号指示低的或没有扭曲特性、或比较高的扭曲特性;提供该时变控制信号,该时变控制信号取决于音频信号;以及依据适用于特定信号态样之第一编码演算法或依据适用以编码一般音频信号之不同的第二编码演算法,来处理该前置滤波音频信号,以得到已编码音频信号。一种解码已编码音频信号之方法,该已编码音频信号具有依据适用于特定信号态样之第一编码演算法而被编码之第一部,及具有依据适用以编码一般音频信号之不同的第二编码演算法而被编码之第二部,其包含:以该第一部或第二部为基础来侦测编码演算法;响应该侦测之步骤,使用对应于第一编码演算法之第一解码演算法来解码该第一部以得到第一解码时间部,并使用对应于第二编码演算法之第二解码演算法来解码第二部以得到第二解码时间部;及于具有低的或没有扭曲特性之第一状态与具有比较高的扭曲特性之第二状态之间,使用可变扭曲特性之后端滤波为可控制的。一种处理音频信号之音频处理器,包含:滤波器,用以产生滤波音频信号,此滤波器具有可变扭曲特性,可响应时变控制信号来控制该扭曲特性,该控制信号指示低的或没有扭曲特性或比较高的扭曲特性;以及控制器,用以提供该时变控制信号,此时变控制信号取决于该音频信号。一种处理音频信号之方法,包含:使用滤波器来产生滤波音频信号,此滤波器具有可变扭曲特性,可响应时变控制信号来控制该扭曲特性,该控制信号指示低的或没有扭曲特性、或比较高的扭曲特性;以及提供该时变控制信号,此时变控制信号取决于该音频信号。一种具有程式码之电脑程式,当操作至电脑上时用以执行申请专利范围第44、45或47项之方法。
地址 德国