语音编码用方法及系统,申请号TW093126447-传众专利搜索

发明名称	语音编码用方法及系统
摘要	一种与用于将音频信号编码成多个参数之编码器有关连之方法与装置。基于该参数之特性，例如，音频信号之音调、发声、能量及振幅频谱资讯，该音频信号可被分段，使得参数更新率最佳化。区段音频信号之参数被记录于储存媒体或被传送至解码器，使得解码器能基于表示区段音频信号之参数以重建音频信号。例如，基于音调特征，音调轮廓能以多个轮廓区段趋近。一调适向下取样方法用于将基于轮廓区段之参数更新，以降低更新率。在解码器中，参数以原始速率更新。
申请公布号	TWI281657	申请公布日期	2007.05.21
申请号	TW093126447	申请日期	2004.09.02
申请人	诺基亚股份有限公司	发明人	安西罗慕;詹尼努米宁;察卡利喜曼宁;阿里黑基宁
分类号	G10L19/12(2006.01)	主分类号	G10L19/12(2006.01)
代理机构		代理人	杜汉淮台北市中山区吉林路24号9楼之6
主权项	1.一种具音频特征之音频信号之编码方法,包括下述步骤: 将音频信号基于音频信号之音频特征分段成多个区段;然后以不同编码设定将该等区段编码。 2.如申请专利范围第1项之方法,其中该音频特征包括音频信号之该等区段内之发声特征。 3.如申请专利范围第1项之方法,其中该音频特征包括音频信号之该等区段内之能量特征。 4.如申请专利范围第2项之方法,其中该音频特征包括音频信号之该等区段内之音调特征。 5.如申请专利范围第1项之方法,其中该分段是与该编码步骤同时实行。 6.如申请专利范围第1项之方法,其中该分段是于该编码步骤之后实行。 7.如申请专利范围第2项之方法,其中多个发声値指定给该等区段之音频信号之发声特征,且该分段基于所指定之发声値实行。 8.如申请专利范围第7项之方法,其中多个发声値包括一个指定给有声语音信号之値,及另一个指定给无声语音信号之値。 9.如申请专利范围第7项之方法,其中多个发声値包括一个介于有声及无声信号之间的转变阶段値。 10.如申请专利范围第7项之方法,其中多个发声値还包括一个指定给语音信号之非活动期间之値。 11.如申请专利范围第1项之方法,尚包括为编码过程选择量化模式之步骤,其中该分段步骤乃基于选择的量化模式而实行。 12.如申请专利范围第1项之方法,其中该分段步骤是基于音频信号重建之选择目标精确度而实行。 13.如申请专利范围第4项之方法,其中该分段步骤是为至少某些该区段提供线性音调表示而实行。 14.如申请专利范围第1项之方法,其中音频信号被编码成音频信号资料,该方法还包括步骤: 基于音频信号资料形成一具有信号资料之第一个号码之参数信号; 向下取样参数信号至信号资料之第二个号码以提供进一步参数信号,其中第二个号码是小于第一个号码;以及向上取样进一步参数信号至信号资料之第三个号码于解码过程,其中第三个号码是小于第二个号码。 15.如申请专利范围第14项之方法,其中第三个号码等于第一个号码。 16.如申请专利范围第14项之方法,其中信号资料包括量化参数。 17.如申请专利范围第14项之方法,其中信号资料包括非量化参数。 18.一种用以产生具音频特征之音频信号之解码器, 其中音频信号是于一编码步骤中被编码成资料率之多个参数,且该编码步骤是基于音频信号之音频特征作调整以提供参数之调整表示法,该解码器包括: 一输入端,其用以接收表示调整表示法之参数之音频资料;以及一个回应音频资料之模组,其基于调整表示法及音频信号之特征产生音频信号。 19.如申请专利范围第18项之解码器,其中音频资料是记录于电子媒体,以及其中解码器输入有效地被连接至电子媒体以接收音频资料。 20.如申请专利范围第18项之解码器,其中音频资料是透过通信频道传送,以及其中解码器输入有效地被连接至通信频道以接收音频资料。 21.一种用以产生具音频特征之音频信号之编码装置,此编码装置包括: 一输入端,其用以接收代表特征之音频资料;以及一调整模组基于音频信号特征用于调整参数以提供参数之调整表示法。 22.如申请专利范围第21项之编码装置,还包括一回应调整表示法之量化模组,其将参数以调整表示法编码。 23.如申请专利范围第21项之编码装置,还包括一有效连接至储存媒体之输出端,其用以将表示调整表示法之编码参数之资料储存至储存媒体。 24.如申请专利范围第21项之编码装置,还包括一有效连接至通信频道之输出端,其用以将表示调整表示法之编码参数之信号提供给传送用通信频道。 25.一种电脑可读取的记忆媒体,供与音频编码装置连用,该音频编码装置将音频信号编码成具音频特征以提供表示音频信号之多个参数,该记忆媒体附载有: 一决定该音频信号之特征所用的程式码;及一根据该音频信号之特征调整该等参数以提供一种已调整参数之表示法所用的程式码。 26.一种电子装置,其包括:一用以产生具音频特征之合成音频信号之解码器,其中之音频信号是于一编码步骤中被编码成资料率之多个参数,且该编码步骤是基于音频信号之音频特征作调整以提供参数之调整表示法;以及一输入端,其接收表示调整表示法参数之音频资料,以提供音频资料给解码器 ,使得解码器基于调整表示法产生音频信号。 27.如申请专利范围第26项之电子装置,其中音频资料被纪录于电子媒体,且其中输入端被有效地连接至电子媒体以接收音频资料。 28.如申请专利范围第26项之电子装置,其中音频资料是经由通信频道传送,且其中输入端被有效地连接至通信频道以接收音频资料。 29.如申请专利范围第26项之电子装置,包括一行动终端机。 30.一种通信网路,其包括:多个基地站;及多个配合基地站通信之行动站,其中至少有一行动站包括: 一解码器,其用以产生具音频特征之合成音频信号 ,其中之音频信号是于一编码步骤中被编码成资料率之多个参数,且该编码步骤是基于音频信号之音频特征作调整以提供参数之调整表示法;以及一输入端,其接收来自至少基地站其中之一,表示调整表示法参数之音频资料,以提供音频资料给解码器 ,使得解码器基于调整表示法产生音频信号。 31.一种用于重建音频信号之解码器,其中音频信号被编码以提供表示音频信号之参数,该参数包括含有表示音频区段于时间上之多个音调値之音调轮廓资料,且该音频区段于时间上之音调轮廓资料可藉在音频区段内之多个次区段趋近,该每个次区段由第一端点与第二端点所界定;该解码器包括: 一输入端,其用以接收表示界定次区段之端点之音频资料;以及一重建模组,其基于接收到的音频资料重建音频区段。图式简单说明: 图1 表示典型语音信号之数位传送及储存之方块图。图2a 表示语音信号波形之时间图。图2b 表示与图2a语音信号关连之音调之时间图。图2c 表示与图2a语音信号关连之发声资讯之时间图。图2d 表示与图2a语音信号关连之能量之时间图。图3a 依据本发明,表示语音信号分段(segmentation)方法之语音信号之时间图。图3b 表示与图3a语音信号关连之语音信号能量之时间图。图3c 表示与图3a语音信号关连之语音信号发声资讯之时间图。图3d 依据本发明,表示语音信号区段之时间图。图4 依据本发明,表示语音编码系统之方块图。图5 依据本发明,表示语音编码器之功能特征之方块图。图6 依据本发明,表示语音解码器之功能特征之方块图。图7 依据本发明,表示调适向下取样(adaptive downsampling)及量化计算法之流程图。图8a 依据本发明,表示增益参数値(gain parameter)之调适位元率之时间图,作为来自调适向下取样之结果。图8b 表示调适向下取样率之时间图。图8c 表示关于真实增益値之绝对误差之时间图。图8d 表示量化模式之时间图。图9a 表示为改进区段执行之参数追踪结果之时间图。图9b 依据本发明实施例,表示量化音调轨迹相较于原始轨迹之时间图。图10 依据本发明,区段方法之实例。图11 依据本发明,表示能传送压缩资料至行动终端机之通信网路之示意图。
地址	芬兰