发明名称 在G.711语音编码中隐藏冗余信息的方法
摘要 本发明提供一种在G.711语音编码中隐藏冗余信息的方法,在语音包编码前进行预处理,使其带有人耳不敏感的隐藏信息,这些信息包含了临近的其它语音包的主要特征,然后用正常的G.711方式编码和发送,在接收端用同样的反向算法进行解码和后处理,即可获得原始语音信息。当发生数据包丢失时,从其临近的其它数据包中获得丢失包的主要语音特征,从而恢复出丢失包的主要语音数据。而对于不知晓该隐藏算法的设备,直接用正常的G.711方式解码也能获得接近原始状态的语音。使系统既能兼容于G.711编码,又能大大提高语音通信的抗丢包能力,改善通话质量。
申请公布号 CN101604523B 申请公布日期 2012.01.04
申请号 CN200910031513.8 申请日期 2009.04.22
申请人 网经科技(苏州)有限公司 发明人 张格伟;承成;刘继明
分类号 G10L19/00(2006.01)I;G10L19/02(2006.01)I 主分类号 G10L19/00(2006.01)I
代理机构 南京苏科专利代理有限责任公司 32102 代理人 陈忠辉;姚姣阳
主权项 在G.711语音编码中隐藏冗余信息的方法,在语音包编码前进行缓冲和前置处理,使语音信息中包含人耳不敏感的被隐藏的冗余信息,被隐藏的冗余信息包含了临近的前若干帧语音包的主要特征,然后用正常的G.711方式编码和发送,在解码端增加与解码同步的缓冲和后置同步处理,恢复正常语音,即接收端用反向算法进行解码和后处理获得原始语音信息;当发生数据包丢失时,从其临近的其它数据包中获得丢失包的主要语音特征,从缓冲区中获得邻近包中含有丢失包特征的数据,重建丢失包的主要语音信号,从而恢复出丢失包的主要语音数据;而对于不知晓该隐藏冗余信息的方法的解码端,直接用正常的G.711方式解码获得接近原始状态的语音,其特征在于:包含以下步骤——①对语音信号进行前置处理,建立语音发送数据缓冲区,对缓冲区中的每一片语音信号变换到频域,根据心理声学模型,提取出频域中包含的主要特征分量,对频域数据去除一部分人耳不敏感的信号,然后把特征分量分散隐藏到缓冲区中邻近的语音包中,最后把隐藏了冗余特征信息的语音包由频域变换回时域;②将隐藏了冗余信息的语音包按正常G.711编码方式进行编码,通过上层通信环境发送到受话方;③在受话方建立接收数据缓冲区,对收到的每一片语音包根据G.711方式进行解码,然后变换到频域,检测是否存在被隐藏的冗余信息,如果存在,将其分离出来,并还原出被压缩部分的语音数据;④当缓冲区设定的超时时间截止后,检查尚未到达的语音包,根据邻近的已到达语音包中分离出来的特征信息,对丢失的语音包进行特征重建,对无法获得特征信息的语音包尝试进行预测重建,最后还原出完整的语音波形信号输出;⑤根据统计的丢包情况估计网络质量,调整冗余信息的密度,在低质量网络中使用更低的原始信号密度和更高的冗余信息密度,体现在回送的语音信号中。
地址 215021 江苏省苏州市工业园区金鸡湖大道1355号国际科技园一期1630单元