发明名称 语音编码用方法及系统
摘要 一种与用于将音频信号编码成多个参数之编码器有关连之方法与装置。基于该参数之特性,例如,音频信号之音调、发声、能量及振幅频谱资讯,该音频信号可被分段,使得参数更新率最佳化。区段音频信号之参数被记录于储存媒体或被传送至解码器,使得解码器能基于表示区段音频信号之参数以重建音频信号。例如,基于音调特征,音调轮廓能以多个轮廓区段趋近。一调适向下取样方法用于将基于轮廓区段之参数更新,以降低更新率。在解码器中,参数以原始速率更新。
申请公布号 TWI281657 申请公布日期 2007.05.21
申请号 TW093126447 申请日期 2004.09.02
申请人 诺基亚股份有限公司 发明人 安西罗慕;詹尼努米宁;察卡利喜曼宁;阿里黑基宁
分类号 G10L19/12(2006.01) 主分类号 G10L19/12(2006.01)
代理机构 代理人 杜汉淮 台北市中山区吉林路24号9楼之6
主权项 1.一种具音频特征之音频信号之编码方法,包括下 述步骤: 将音频信号基于音频信号之音频特征分段成多个 区段;然后 以不同编码设定将该等区段编码。 2.如申请专利范围第1项之方法,其中该音频特征包 括音频信号之该等区段内之发声特征。 3.如申请专利范围第1项之方法,其中该音频特征包 括音频信号之该等区段内之能量特征。 4.如申请专利范围第2项之方法,其中该音频特征包 括音频信号之该等区段内之音调特征。 5.如申请专利范围第1项之方法,其中该分段是与该 编码步骤同时实行。 6.如申请专利范围第1项之方法,其中该分段是于该 编码步骤之后实行。 7.如申请专利范围第2项之方法,其中多个发声値指 定给该等区段之音频信号之发声特征,且该分段基 于所指定之发声値实行。 8.如申请专利范围第7项之方法,其中多个发声値包 括一个指定给有声语音信号之値,及另一个指定给 无声语音信号之値。 9.如申请专利范围第7项之方法,其中多个发声値包 括一个介于有声及无声信号之间的转变阶段値。 10.如申请专利范围第7项之方法,其中多个发声値 还包括一个指定给语音信号之非活动期间之値。 11.如申请专利范围第1项之方法,尚包括为编码过 程选择量化模式之步骤,其中该分段步骤乃基于选 择的量化模式而实行。 12.如申请专利范围第1项之方法,其中该分段步骤 是基于音频信号重建之选择目标精确度而实行。 13.如申请专利范围第4项之方法,其中该分段步骤 是为至少某些该区段提供线性音调表示而实行。 14.如申请专利范围第1项之方法,其中音频信号被 编码成音频信号资料,该方法还包括步骤: 基于音频信号资料形成一具有信号资料之第一个 号码之参数信号; 向下取样参数信号至信号资料之第二个号码以提 供进一步参数信号,其中第二个号码是小于第一个 号码;以及 向上取样进一步参数信号至信号资料之第三个号 码于解码过程,其中第三个号码是小于第二个号码 。 15.如申请专利范围第14项之方法,其中第三个号码 等于第一个号码。 16.如申请专利范围第14项之方法,其中信号资料包 括量化参数。 17.如申请专利范围第14项之方法,其中信号资料包 括非量化参数。 18.一种用以产生具音频特征之音频信号之解码器, 其中音频信号是于一编码步骤中被编码成资料率 之多个参数,且该编码步骤是基于音频信号之音频 特征作调整以提供参数之调整表示法,该解码器包 括: 一输入端,其用以接收表示调整表示法之参数之音 频资料;以及 一个回应音频资料之模组,其基于调整表示法及音 频信号之特征产生音频信号。 19.如申请专利范围第18项之解码器,其中音频资料 是记录于电子媒体,以及其中解码器输入有效地被 连接至电子媒体以接收音频资料。 20.如申请专利范围第18项之解码器,其中音频资料 是透过通信频道传送,以及其中解码器输入有效地 被连接至通信频道以接收音频资料。 21.一种用以产生具音频特征之音频信号之编码装 置,此编码装置包括: 一输入端,其用以接收代表特征之音频资料;以及 一调整模组基于音频信号特征用于调整参数以提 供参数之调整表示法。 22.如申请专利范围第21项之编码装置,还包括一回 应调整表示法之量化模组,其将参数以调整表示法 编码。 23.如申请专利范围第21项之编码装置,还包括一有 效连接至储存媒体之输出端,其用以将表示调整表 示法之编码参数之资料储存至储存媒体。 24.如申请专利范围第21项之编码装置,还包括一有 效连接至通信频道之输出端,其用以将表示调整表 示法之编码参数之信号提供给传送用通信频道。 25.一种电脑可读取的记忆媒体,供与音频编码装置 连用,该音频编码装置将音频信号编码成具音频特 征以提供表示音频信号之多个参数,该记忆媒体附 载有: 一决定该音频信号之特征所用的程式码;及 一根据该音频信号之特征调整该等参数以提供一 种已调整参数之表示法所用的程式码。 26.一种电子装置,其包括:一用以产生具音频特征 之合成音频信号之解码器,其中之音频信号是于一 编码步骤中被编码成资料率之多个参数,且该编码 步骤是基于音频信号之音频特征作调整以提供参 数之调整表示法;以及一输入端,其接收表示调整 表示法参数之音频资料,以提供音频资料给解码器 ,使得解码器基于调整表示法产生音频信号。 27.如申请专利范围第26项之电子装置,其中音频资 料被纪录于电子媒体,且其中输入端被有效地连接 至电子媒体以接收音频资料。 28.如申请专利范围第26项之电子装置,其中音频资 料是经由通信频道传送,且其中输入端被有效地连 接至通信频道以接收音频资料。 29.如申请专利范围第26项之电子装置,包括一行动 终端机。 30.一种通信网路,其包括:多个基地站;及多个配合 基地站通信之行动站,其中至少有一行动站包括: 一解码器,其用以产生具音频特征之合成音频信号 ,其中之音频信号是于一编码步骤中被编码成资料 率之多个参数,且该编码步骤是基于音频信号之音 频特征作调整以提供参数之调整表示法;以及一输 入端,其接收来自至少基地站其中之一,表示调整 表示法参数之音频资料,以提供音频资料给解码器 ,使得解码器基于调整表示法产生音频信号。 31.一种用于重建音频信号之解码器,其中音频信号 被编码以提供表示音频信号之参数,该参数包括含 有表示音频区段于时间上之多个音调値之音调轮 廓资料,且该音频区段于时间上之音调轮廓资料可 藉在音频区段内之多个次区段趋近,该每个次区段 由第一端点与第二端点所界定;该解码器包括: 一输入端,其用以接收表示界定次区段之端点之音 频资料;以及 一重建模组,其基于接收到的音频资料重建音频区 段。 图式简单说明: 图1 表示典型语音信号之数位传送及储存之方块 图。 图2a 表示语音信号波形之时间图。 图2b 表示与图2a语音信号关连之音调之时间图。 图2c 表示与图2a语音信号关连之发声资讯之时间 图。 图2d 表示与图2a语音信号关连之能量之时间图。 图3a 依据本发明,表示语音信号分段(segmentation)方 法之语音信号之时间图。 图3b 表示与图3a语音信号关连之语音信号能量之 时间图。 图3c 表示与图3a语音信号关连之语音信号发声资 讯之时间图。 图3d 依据本发明,表示语音信号区段之时间图。 图4 依据本发明,表示语音编码系统之方块图。 图5 依据本发明,表示语音编码器之功能特征之方 块图。 图6 依据本发明,表示语音解码器之功能特征之方 块图。 图7 依据本发明,表示调适向下取样(adaptive downsampling)及量化计算法之流程图。 图8a 依据本发明,表示增益参数値(gain parameter)之 调适位元率之时间图,作为来自调适向下取样之结 果。 图8b 表示调适向下取样率之时间图。 图8c 表示关于真实增益値之绝对误差之时间图。 图8d 表示量化模式之时间图。 图9a 表示为改进区段执行之参数追踪结果之时间 图。 图9b 依据本发明实施例,表示量化音调轨迹相较于 原始轨迹之时间图。 图10 依据本发明,区段方法之实例。 图11 依据本发明,表示能传送压缩资料至行动终端 机之通信网路之示意图。
地址 芬兰