发明名称 一种基于G.711.1的语音带宽扩展的装置和方法
摘要 本发明公开了一种基于G.711.1的语音带宽扩展的装置和方法。本发明将G.711.1协议中的高频语音码流进一步压缩,将压缩后的数据使用最低有效位的水印嵌入算法嵌入到窄带语音的编码码流中,解码端使用提取出的高频码流合成宽带语音的高频部分,从而得到宽带语音。本发明提供了分层编码的新解决方案,在窄带语音的传输中建立一条隐藏的信道,用于传输分层编码协议中高频信号的编码码流。这样既利用了分层编码得出宽带语音听觉效果好的优势,同时不会改变现有网络的传输速率。经仿真测试,该方法得到的宽带语音引入的高频噪声小,听觉效果跟原始宽带语音相差极小。
申请公布号 CN102522092A 申请公布日期 2012.06.27
申请号 CN201110422386.1 申请日期 2011.12.16
申请人 大连理工大学 发明人 陈喆;殷福亮;赵承勇
分类号 G10L21/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 大连星海专利事务所 21208 代理人 徐淑东
主权项 1.一种基于G.711.1的语音带宽扩展的方法,将采样频率为16KHz的宽带输入语音信号通过一个双通道QMF分析滤波器模块,并降低采样频率,得到0~4KHz的窄带语音和4~8KHz的高频分量;窄带语音通过G.711编码模块产生传输的码流;使用MDCT系数提取模块从高频分量中提取出语音的MDCT系数,将其通入加权模块和归一化模块进行处理,处理后的参数使用矢量量化模块进行压缩,并对增益进行量化;将得到的索引值等信息嵌入到窄带码流中;在解码端提取出高频参数索引,通入反归一化模块和反加权模块,得到的高频参数通入恢复高频分量模块,进而合成宽带语音;包括以下步骤:步骤A. 预处理和QMF分析滤波模块,包括以下子步骤:步骤A1.预处理模块:为了去除50Hz工频干扰和直流分量,首先将宽带语音通过一个高通滤波器:<img file="896219DEST_PATH_IMAGE001.GIF" wi="329" he="22" />;经过滤波器后的语音为16KHz采样频率的宽带语音;步骤A2.使用QMF分析滤波器组模块将宽带语音分成两个部分:0~8000Hz的窄带语音和8000~16000Hz的高频分量,并分别通入下采样模块;得到8kHz采样频率的窄带语音和高频分量;其中,QMF分析滤波器模块使用32阶的FIR滤波器,高通滤波器模块<img file="242887DEST_PATH_IMAGE002.GIF" wi="40" he="19" />是由低通滤波器模块<img file="655414DEST_PATH_IMAGE003.GIF" wi="37" he="20" />频移得到,也就是使用复正弦序列<img file="480150DEST_PATH_IMAGE004.GIF" wi="25" he="18" />调制,即:<img file="225515DEST_PATH_IMAGE005.GIF" wi="200" he="26" />;B.提取和编码MDCT系数模块,包括以下子步骤:步骤B1.提取MDCT系数模块:采用G.711.1协议中的方法,取5ms的高频分量作为一帧,每帧包含40个采样点,使用80个采样点的分析窗进行加窗处理,并进行部分重叠相加;高频分量的MDCT系数定义为:<img file="743084DEST_PATH_IMAGE006.GIF" wi="518" he="47" />;其中,<img file="642907DEST_PATH_IMAGE007.GIF" wi="61" he="24" />是分析窗,这里定义为:<img file="271334DEST_PATH_IMAGE008.GIF" wi="348" he="43" />;为了减小MDCT系数的动态变换范围,通入归一化参数模块进行处理;归一化参数计算方法如下:<img file="369740DEST_PATH_IMAGE009.GIF" wi="217" he="43" />;步骤B2. 编码MDCT系数模块:使用单通道的码本对MDCT参数进行矢量量化,包括以下步骤:首先,MDCT系数通入加权处理模块,得到加权后的MDCT系数<img file="995894DEST_PATH_IMAGE010.GIF" wi="51" he="23" />;<img file="946794DEST_PATH_IMAGE011.GIF" wi="30" he="16" />为均方根因子,使用加权后的MDCT系数进行计算:<img file="113333DEST_PATH_IMAGE012.GIF" wi="189" he="52" />;归一化MDCT系数计算方法如下:<img file="331825DEST_PATH_IMAGE013.GIF" wi="107" he="52" />;其中,<img file="128880DEST_PATH_IMAGE014.GIF" wi="20" he="19" />是为了避免分母为零而加上的一个数,<img file="800033DEST_PATH_IMAGE014.GIF" wi="20" he="19" />使用下面公式计算:<img file="554885DEST_PATH_IMAGE015.GIF" wi="68" he="25" />;得到归一化MDCT系数后,将40个系数分裂为6个6维矢量,其余4系数个置为0,对每个6维矢量通入矢量量化模块进行压缩,码本中码字的个数为64,这样每个矢量用码字的序号表示只需6bit;这样每帧MDCT系数经矢量量化后占用36bit,量化后的增益I<sub>Hg</sub>占8bit,每帧所有信息共使用44bit;一帧窄带信号有40个采样点,平均每个采样点嵌入1bit高频信息,然后将剩余的4bit均匀嵌入到一帧的码流中;C. 高频语音恢复与宽带语音合成模块,包括以下子步骤:在解码端首先提取出的MDCT系数和增益的索引,然后使用索引对MDCT系数进行参数解码;使用MDCT系数索引I(v)在码本中进行搜索,得到40个归一化的系数,前4个系数为0;使用增益索引得到增益值,经过反量化得到均方根因子<img file="565566DEST_PATH_IMAGE016.GIF" wi="25" he="20" />,使用均方根因子对归一化的MDCT系数进行处理,得到归一化之前的系数:<img file="595839DEST_PATH_IMAGE017.GIF" wi="152" he="41" />;归一化之前的系数经过反加权模块,即除以对应点的加权系数,得到原始的MDCT系数<img file="691971DEST_PATH_IMAGE018.GIF" wi="53" he="24" />;使用原始MDCT系数通入反变换模块:<img file="200313DEST_PATH_IMAGE019.GIF" wi="350" he="44" />;其中,<img file="393397DEST_PATH_IMAGE020.GIF" wi="68" he="25" />是反变换之后没有加下一帧重叠窗时的时域信号,最终得到的高频部分的时域信号为:<img file="532254DEST_PATH_IMAGE021.GIF" wi="351" he="27" />;其中,<img file="679464DEST_PATH_IMAGE022.GIF" wi="61" he="24" />是重叠的分析窗,<img file="929180DEST_PATH_IMAGE023.GIF" wi="70" he="27" />是上一帧没有经过窗函数的时域信号;步骤D.水印的嵌入与提取,包括以下子步骤:采用最低有效位嵌入算法将MDCT系数的索引和增益索引嵌入到窄带码流的最低位中;由于一帧信号有40个采样点,而嵌入水印的比特数为44bit,首先在每个采样点的最低位嵌入40bit;最后将4bit均匀的嵌入到一帧中的次低位;提取水印时分别提取码流最低位的信息和4个采样点的次低位信息,从而得到嵌入的44bit MDCT系数;E.通过QMF合成滤波器组模块将接收的码流进行A律解码,得到8KHz采样频率的低频信号,将低频信号和恢复出的高频信号通过插值模块将采样频率变为16KHz,分别将其通过低通和高通FIR滤波器;将两信号相加即得到最终16KHz采样频率的宽带信号。
地址 116024 辽宁省大连市高新园区凌工路2号