发明名称 一种基于音频片段切分的数字音频时域压缩方法
摘要 本发明涉及一种基于音频片段切分的数字音频时域压缩方法,属于音频处理技术领域。本方法通过提取乐曲的数字音频中的音频特征,分析并获得乐曲的结构信息,根据乐曲的结构信息选择并删除若干个可删除音频片段序列,最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩,从而改变乐曲的播放时间长度。本发明方法在数字音频时域压缩前,根据乐曲的结构信息找到满足特定条件的音频片段子序列,删除音频片段子序列后,可以保证乐曲中剩下的音频片段自然、平滑地连接,减少了数字音频时域压缩对数字音频播放质量的影响,改善了时域压缩后的数字音频的播放效果。
申请公布号 CN102063919B 申请公布日期 2012.05.09
申请号 CN201010570222.9 申请日期 2010.11.26
申请人 清华大学 发明人 王朝坤;王建民;刘璋
分类号 G11B20/14(2006.01)I 主分类号 G11B20/14(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 罗文群
主权项 1.一种基于音频片段切分的数字音频时域压缩方法,其特征在于该方法包括以下步骤:(1)将原始乐曲数字音频分为n个音频片段,得到一个音频片段序列,记为:s<sub>1</sub>、s<sub>2</sub>、s<sub>3</sub>、……、s<sub>n-1</sub>、s<sub>n</sub>,设音频片段s<sub>i</sub>的原始时间长度为t<sub>i</sub>;(2)根据用户设定的压缩后的乐曲数字音频的时间长度T<sub>u</sub>和压缩过程中的乐曲数字音频的当前时间长度T<sub>m</sub>,得到时域压缩率<img file="FSB00000714727600011.GIF" wi="195" he="102" />时域压缩率的取值范围为0<p<1;(3)对上述时域压缩率p进行判断,若p小于或者等于用户设定的最小压缩率p<sub>min</sub>,则转至步骤(4),若时域压缩率p大于用户设定的最小压缩率p<sub>min</sub>,最小压缩率p<sub>min</sub>的取值范围为0<p<sub>min</sub><1,则转至步骤(8);(4)对上述n个音频片段中的任意两个音频片段s<sub>i</sub>、s<sub>j</sub>,使用音频片段相似度量方法计算音频片段s<sub>i</sub>与音频片段s<sub>j</sub>之间的相似度值d<sub>i,j</sub>,对相似度值d<sub>i,j</sub>进行判断,若相似度值d<sub>i,j</sub>大于或者等于设定的相似度阈值I,则判断音频片段s<sub>i</sub>与音频片段s<sub>j</sub>为相似音频片段,若相似度值d<sub>i,j</sub>小于设定的相似度阈值I,则判断音频片段s<sub>i</sub>与音频片段s<sub>j</sub>为不相似音频片段,重复该步骤,遍历n个音频片段中的任意两个音频片段,得到所有任意两个音频片段之间的相似关系,相似度阈值I为从正无穷到负无穷的实数,相似度值的取值范围为-∞<d<sub>i,j</sub><∞;(5)根据上述音频片段之间的相似关系,将n个音频片段分为w个音频片段组,记为:G<sub>1</sub>、G<sub>2</sub>、…、G<sub>x</sub>、…、G<sub>w</sub>,满足音频片段组G<sub>x</sub>中的任意一个音频片段s<sub>i</sub>,在G<sub>x</sub>中至少存在一个与音频片段s<sub>i</sub>相似的音频片段s<sub>j</sub>,且在音频片段组G<sub>x</sub>以外的音频片段组中不存在与音频片段s<sub>i</sub>相似的音频片段;(6)为每个音频片段组G<sub>i</sub>设置一个唯一的音频片段组标识符A<sub>i</sub>,用一个音频片段组标识符A<sub>i</sub>对音频片段组G<sub>i</sub>中的所有音频片段进行标记;用音频片段组标识符A<sub>i</sub>表达上述音频片段序列s<sub>1</sub>、s<sub>2</sub>、s<sub>3</sub>、……、s<sub>n-1</sub>、s<sub>n</sub>,得到与乐曲的音频片段序列相对应的音频片段组标识符序列;形成一个可删除子序列s<sub>b</sub>、s<sub>b+1</sub>、……、s<sub>e-1</sub>、s<sub>e</sub>,该可删除子序列满足:在音频片段标识符序列中存在两个相邻的音频片段标识符,该两个音频片段标识符分别与音频片段s<sub>b-1</sub>和音频片段组标识符与s<sub>e+1</sub>相对应,其中,b和e为正整数,1<b≤e<n;遍历音频片段组标识符序列,得到所有可删除子序列;(7)从上述音频片段序列中删除一个可删除子序列,使删除可删除子序列后的乐曲数字音频的时间长度T<sub>c</sub>与用户设定的压缩后的乐曲数字音频的时间长度T<sub>u</sub>之间的差值的绝对值最小,转至步骤(2);(8)根据步骤(2)得到时域压缩率p,使用数字音频时域压缩方法对上述数字音频文件进行时域压缩。
地址 100084 北京市海淀区清华园1号