发明名称 基于原子预选择的音频匹配追踪方法与系统
摘要 本发明公开了一种基于原子预选择的音频匹配追踪方法与系统,本发明首先利用信号能量与听觉感知之间存在的相关性,对原始信号进行基于能量的预处理,提取其能量分布较高的部分信号;再针对该部分信号进行匹配跟踪,得稀疏系数;通过稀疏系数与原始字典进行信号重构。本发明在保证音质无下降的同时可大幅降低计算复杂度和计算速度。
申请公布号 CN105551503A 申请公布日期 2016.05.04
申请号 CN201510982266.5 申请日期 2015.12.24
申请人 武汉大学 发明人 胡瑞敏;姜林;胡霞;王晓晨;涂卫平;张茂胜;李登实
分类号 G10L25/54(2013.01)I;G10L25/21(2013.01)I 主分类号 G10L25/54(2013.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 胡艳
主权项 一种基于原子预选择的音频匹配追踪方法,其特征是,包括:信号分解和信号重构,其中,信号分解包括步骤:S1根据原始信号类型选择短时字典,并以短时字典为稀疏字典;S2逐一计算原始信号中连续样本{S<sub>i</sub>,S<sub>i+1</sub>,...S<sub>i+N‑1</sub>}的能量,i依次取1、2、…length(S)‑N+1,提取能量最高的连续样本,记为S<sub>maxenergy</sub>;N为短时字典原子长度;length(S)为原始信号长度;S3获得稀疏字典各原子在S<sub>maxenergy</sub>上的原子权重,原子权重绝对值的最大值为<img file="FDA0000888897000000011.GIF" wi="151" he="70" />S4计算信号残差<img file="FDA0000888897000000012.GIF" wi="574" he="79" /><img file="FDA0000888897000000013.GIF" wi="134" he="61" />为<img file="FDA0000888897000000014.GIF" wi="115" he="60" />对应的原子;同时,将<img file="FDA0000888897000000015.GIF" wi="116" he="62" />记录于当前稀疏系数矩阵的第i<sub>opt</sub>max行第j<sub>opt</sub>max列,i<sub>opt</sub>max为<img file="FDA0000888897000000016.GIF" wi="133" he="63" />的原子标号,j<sub>opt</sub>max为<img file="FDA0000888897000000017.GIF" wi="133" he="63" />的原子中心位置,当前稀疏系数矩阵初始值为零矩阵;S5当信号残差S′<sub>later</sub>达到目标SNR或迭代次数达到预设值时,结束信号分解,输出当前稀疏系数矩阵;否则,将当前信号残差S′<sub>later</sub>作为原始信号重复步骤2~5;信号重构包括:S7提取当前稀疏系数矩阵中原子权重及其对应的行号、列号;S8将原子权重分别与对应的原子做乘积得恢复信号,将各恢复信号分别赋值给与步骤1中原始信号长度相同的零向量M<sub>i</sub>,以零向量M<sub>i</sub>第j<sub>opt</sub>max个点为恢复信号的中心点,j<sub>opt</sub>max为当前恢复信号对应原子权重的列号;赋值后的向量依次累加得重构信号。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学