发明名称 立体声音频信号的空间参数量化及熵编码方法和所用系统
摘要 本发明公开了一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构,首先将立体声音频信号的空间参数的量化在不同的频带使用不同的量化表,通过查表进行非线性的标量量化,然后将得到的各个空间参数的量化指标组合成一个向量,并与上一帧的量化指标向量差分,最后根据当前频带对应的Huffman码表将得到差分量化指标向量进行Huffman熵编码。本发明利用空间参数听觉感知与频带的依赖关系以及空间参数间的相关性,有效去除空间参数的主观和客观冗余,可以在同样的编码码率下提高空间参数立体声编码的音质,或者在同样的编码音质下,降低编码码率。
申请公布号 CN101188878B 申请公布日期 2010.06.02
申请号 CN200710168614.0 申请日期 2007.12.05
申请人 武汉大学 发明人 胡瑞敏;陈水仙;艾浩军
分类号 H04S3/00(2006.01)I;H04S5/00(2006.01)I;G10L19/00(2006.01)I 主分类号 H04S3/00(2006.01)I
代理机构 武汉华旭知识产权事务所 42214 代理人 刘荣
主权项 一种立体声音频信号的空间参数量化及熵编码方法,其特征在于包括以下步骤:(1)输入立体声音频信号的空间参数:声道间时间差、声道间强度差和声道间相关度,根据空间参数对应的频率找到匹配的非线性量化表,进行非线性标量量化,得到量化指标,其中非线性量化表的建立包括以下步骤:(1-a)根据人耳的空间听觉特性和人耳对空间参数不同的分辨能力,将全频域20~16000Hz划分为若干频段;(1-b)用窄带立体声作测试音,在每个测试频率点上,测试系统通过耳机顺次回放空间参数单调上升的测试序列,测试者主观判断与测试频率点相邻的点是否有差异,并记录;(1-c)收集多个测试者的测试数据,找出平均的最小可感知差异值,并以此为间隔,得到每个频段初始的空间参数量化表;(2)将在同一频率处的各个空间参数量化指标组成一个量化指标向量;(3)将当前帧的量化指标向量与上一帧的量化指标向量做差分运算,得到差分量化指标向量;(4)根据差分量化指标向量对应的频率找到匹配的Huffman码表,进行Huffman编码,输出Huffman码字,Huffman码表的建立包括以下步骤:(4-a)用一系列涵盖各个类型且具有统计代表性的立体声信号作为测试信号集;(4-b)在不同的频段上分别计算测试信号集中所有信号的左右声道声音信号最大归一化相关度的时间偏移值、左右声道声音信号归一化相关度值和左右声道声音信号的能量比值;(4-c)根据上述各个空间参数的非线性量化表,计算出每个空间参数的量化指标;(4-d)根据给定的参数选取方案,将选定的参数组成指标向量;(4-e)将前后两帧的指标向量相减得到差分指标向量;(4-f)统计不同差分指标向量出现的次数,得到差分指标向量的概率分布;(4-g)根据差分指标向量的概率分布,通过标准的Huffman码表构造方法,得到Huffman码表。
地址 430072 湖北省武汉市武昌珞珈山