发明名称 三维音频编码中双耳线索感知特性的自适应测量方法
摘要 为了解决三维音频中声道数过多、数据量过大的问题,通过将各声道下混并提取表达空间信息的双耳线索,可以有效降低三维音频的编码码率。本发明公开了一种三维音频编码中双耳线索感知特性的自适应测试方法,采取迂回逼近的方法,根据测试结果自适应调整双耳线索变化步长,来定位双耳线索的恰可感知差异,指导空间音频的量化编码。
申请公布号 CN102637432B 申请公布日期 2013.12.18
申请号 CN201210074321.7 申请日期 2012.03.20
申请人 武汉大学 发明人 胡瑞敏;王恒;涂卫平;刘进峰;王晓晨;杨玉红;高戈
分类号 G10L25/78(2013.01)I;H04S7/00(2006.01)I 主分类号 G10L25/78(2013.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 薛玲
主权项 一种三维音频编码中双耳线索感知特性的自适应测试方法,其特征在于,包含以下步骤:步骤1,在一个测试频率下,根据预设的参考音双耳线索SPref与变化步长SPd生成测试序列,所述测试频率记为X;测试序列的实时生成方法为,以预设的时间间隔将参考音与测试音组合成一个测试序列,组合时前后顺序随机排列,测试音双耳线索SPtest=SPref+SPd;第一次执行步骤1时,变化步长SPd采用预设的初值;步骤2,根据采用步骤1所得测试序列进行测试的判断结果实时改变变化步长SPd的值,实现方式如下,置正确数NR=0为初始状态,当判断结果正确时,则将错误数NW置为0,将正确数NR加1,直到连续NR=N1次判断结果正确后,则减小变化步长SPd的值,并将正确数NR和错误数NW置0,判断是否出现反转,是则保存当前反转次数和变化步长SPd当前的值并进入步骤3,否则返回步骤1根据变化步长SPd当前的值生成测试序列;当判断结果错误时,将正确数NR置为0,将错误数NW加1,当连续NW=N2次判断结果错误后,则增加变化步长SPd的值,并将正确数NR和错误数NW置0,判断是否出现反转,是则保存当前反转次数和变化步长SPd当前的值并进入步骤3,否则返回步骤1根据变化步长SPd当前的值生成测试序列;其中,N1和N2分别为预设的减小SPd值次数阈值和增加SPd值次数阈值;所述反转,是指变化步长SPd从增加变化为减小或者从减小变为增加,则称为一次反转,从第一次执行步骤2到当前总共的反转次数即是当前反转次数;在连续NR=N1次判断结果正确后,减小变化步长SPd的值实现方式为令SPd=SPd/gain–step;连续NW=N2次判断结果错误后,增加变化步长SPd的值实现方式为令SPd=SPd*gain+step;其中,gain是指数变化参数,step是线性变化参数;步骤3,根据预设的反转次数阈值L,若当前反转次数达到L次,则进入步骤4,若当前反转次数没有达到L次,则返回步骤1根据变化步长SPd当前的值生成测试序列;设gain的取值有g1,g2,g3,g4四种,step的取值有s1,s2,s3,s4四种;设当前反转次数记为reversals,为reversals设置R1,R2,R3,R4四种临界取值,R1<R2<R3<R4=L;为变化步长SPd的值设置SP1、SP2、SP3三种临界取值,SP1<SP2<SP3;在步骤3中,若当前反转次数没有达到L次,进行以下处理调整指数变化参数gain和线性变化参数step的值后返回步骤1,判断是否reversals>R1,是则判断是否reversals>R2,否则令gain=g1、step=s1;若reversals>R2,则判断是否reversals>R3,否则判断是否SPd>SP1,是则令gain=g1、step=s1,否则令gain=g2、step=s2;若reversals>R3,则判断是否reversals>R4,否则判断是否SPd>SP2,是则令gain=g2、step=s2,否则令gain=g3、step=s3;若reversals=R4,则进入步骤4,否则判断是否SPd>SP3,是则令gain=g3、step=s3,否则令gain=g4、step=s4;步骤4,对最近t次反转时的变化步长SPd的值取平均,得到测试频率X下测试的恰可感知差异平均值,t为预设次数值。
地址 430072 湖北省武汉市武昌珞珈山武汉大学