发明名称 一种移动音源空间音频参数预测编解码方法及系统
摘要 本发明涉及音频技术领域,尤其涉及一种移动音源空间音频参数预测编解码方法及系统。本发明提供的编码方法包括输入多声道音频信号,对输入的多声道音频信号提取空间音频参数,根据移动音源速度对当前帧的空间音频参数做出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差,对当前帧的空间音频参数预测残差进行编码得到编码码流,本发明提供的解码方法包括输入编码码流,从编码码流中解码得到空间音频参数预测残差,根据移动音源速度和当前帧空间音频参数预测残差重建当前帧空间音频参数。本发明根据多普勒效应、运动学原理、几何声学原理和波动声学原理来对移动音源空间参数变化作出准确估计,预测误差小,可有效降低编码码率。
申请公布号 CN101673549B 申请公布日期 2011.12.14
申请号 CN200910272282.X 申请日期 2009.09.28
申请人 武汉大学 发明人 胡瑞敏;周成;高丽;杭波;王晓晨
分类号 G10L19/04(2006.01)I 主分类号 G10L19/04(2006.01)I
代理机构 武汉华旭知识产权事务所 42214 代理人 周宗贵
主权项 1.一种移动音源空间音频参数预测编码方法,其特征在于,包括以下步骤:①输入多声道音频信号;②对输入的多声道音频信号提取空间音频参数;③根据移动音源速度对当前帧的空间音频参数做出预测,得到当前帧的空间音频参数预测系数和空间音频参数预测残差;④对当前帧的空间音频参数预测残差进行编码得到编码码流;所述步骤②执行后,获得耳间时间差ITD和耳间强度差ILD;所述步骤③中,根据耳间时间差ITD减去预测耳间时间差ITD得到耳间时间差ITD预测残差,根据耳间强度差ILD减去预测耳间强度差ILD得到耳间强度差ILD预测残差;其中,对于水平面θ(t)方向输入的平面声波,所述预测耳间时间差ITD为:<img file="FSB00000611585500011.GIF" wi="1796" he="161" />所述预测耳间强度差ILD为:<img file="FSB00000611585500012.GIF" wi="1945" he="530" />其中,移动音源在介质中传播速度为u、频率为<img file="DEST_PATH_IMAGE002.GIF" wi="21" he="22" />,其从初始位置A(r<sub>0</sub>,θ<sub>0</sub>)以恒定水平速度v经过时间t=Δt*f移动到位置B(r<sub>t</sub>,θ<sub>t</sub>),r,θ分别为半径与方位角,Δt为帧间时间间隔,f为当前帧帧数,头部近似成半径为a的球体,双耳近似成球面上相对的两点。
地址 430072 湖北省武汉市武昌珞珈山