一种基于音频片段切分的数字音频时域压缩方法,申请号CN201010570222.9-传众专利搜索

发明名称	一种基于音频片段切分的数字音频时域压缩方法
摘要	本发明涉及一种基于音频片段切分的数字音频时域压缩方法，属于音频处理技术领域。本方法通过提取乐曲的数字音频中的音频特征，分析并获得乐曲的结构信息，根据乐曲的结构信息选择并删除若干个可删除音频片段序列，最后使用数字音频时域压缩方法对删除后的数字音频进行时域压缩，从而改变乐曲的播放时间长度。本发明方法在数字音频时域压缩前，根据乐曲的结构信息找到满足特定条件的音频片段子序列，删除音频片段子序列后，可以保证乐曲中剩下的音频片段自然、平滑地连接，减少了数字音频时域压缩对数字音频播放质量的影响，改善了时域压缩后的数字音频的播放效果。
申请公布号	CN102063919B	申请公布日期	2012.05.09
申请号	CN201010570222.9	申请日期	2010.11.26
申请人	清华大学	发明人	王朝坤;王建民;刘璋
分类号	G11B20/14(2006.01)I	主分类号	G11B20/14(2006.01)I
代理机构	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人	罗文群
主权项	1.一种基于音频片段切分的数字音频时域压缩方法，其特征在于该方法包括以下步骤：(1)将原始乐曲数字音频分为n个音频片段，得到一个音频片段序列，记为：s<sub>1</sub>、s<sub>2</sub>、s<sub>3</sub>、……、s<sub>n-1</sub>、s<sub>n</sub>，设音频片段s<sub>i</sub>的原始时间长度为t<sub>i</sub>；(2)根据用户设定的压缩后的乐曲数字音频的时间长度T<sub>u</sub>和压缩过程中的乐曲数字音频的当前时间长度T<sub>m</sub>，得到时域压缩率<img file="FSB00000714727600011.GIF" wi="195" he="102" />时域压缩率的取值范围为0＜p＜1；(3)对上述时域压缩率p进行判断，若p小于或者等于用户设定的最小压缩率p<sub>min</sub>，则转至步骤(4)，若时域压缩率p大于用户设定的最小压缩率p<sub>min</sub>，最小压缩率p<sub>min</sub>的取值范围为0＜p<sub>min</sub>＜1，则转至步骤(8)；(4)对上述n个音频片段中的任意两个音频片段s<sub>i</sub>、s<sub>j</sub>，使用音频片段相似度量方法计算音频片段s<sub>i</sub>与音频片段s<sub>j</sub>之间的相似度值d<sub>i，j</sub>，对相似度值d<sub>i，j</sub>进行判断，若相似度值d<sub>i，j</sub>大于或者等于设定的相似度阈值I，则判断音频片段s<sub>i</sub>与音频片段s<sub>j</sub>为相似音频片段，若相似度值d<sub>i，j</sub>小于设定的相似度阈值I，则判断音频片段s<sub>i</sub>与音频片段s<sub>j</sub>为不相似音频片段，重复该步骤，遍历n个音频片段中的任意两个音频片段，得到所有任意两个音频片段之间的相似关系，相似度阈值I为从正无穷到负无穷的实数，相似度值的取值范围为-∞＜d<sub>i，j</sub>＜∞；(5)根据上述音频片段之间的相似关系，将n个音频片段分为w个音频片段组，记为：G<sub>1</sub>、G<sub>2</sub>、…、G<sub>x</sub>、…、G<sub>w</sub>，满足音频片段组G<sub>x</sub>中的任意一个音频片段s<sub>i</sub>，在G<sub>x</sub>中至少存在一个与音频片段s<sub>i</sub>相似的音频片段s<sub>j</sub>，且在音频片段组G<sub>x</sub>以外的音频片段组中不存在与音频片段s<sub>i</sub>相似的音频片段；(6)为每个音频片段组G<sub>i</sub>设置一个唯一的音频片段组标识符A<sub>i</sub>，用一个音频片段组标识符A<sub>i</sub>对音频片段组G<sub>i</sub>中的所有音频片段进行标记；用音频片段组标识符A<sub>i</sub>表达上述音频片段序列s<sub>1</sub>、s<sub>2</sub>、s<sub>3</sub>、……、s<sub>n-1</sub>、s<sub>n</sub>，得到与乐曲的音频片段序列相对应的音频片段组标识符序列；形成一个可删除子序列s<sub>b</sub>、s<sub>b+1</sub>、……、s<sub>e-1</sub>、s<sub>e</sub>，该可删除子序列满足：在音频片段标识符序列中存在两个相邻的音频片段标识符，该两个音频片段标识符分别与音频片段s<sub>b-1</sub>和音频片段组标识符与s<sub>e+1</sub>相对应，其中，b和e为正整数，1＜b≤e＜n；遍历音频片段组标识符序列，得到所有可删除子序列；(7)从上述音频片段序列中删除一个可删除子序列，使删除可删除子序列后的乐曲数字音频的时间长度T<sub>c</sub>与用户设定的压缩后的乐曲数字音频的时间长度T<sub>u</sub>之间的差值的绝对值最小，转至步骤(2)；(8)根据步骤(2)得到时域压缩率p，使用数字音频时域压缩方法对上述数字音频文件进行时域压缩。
地址	100084 北京市海淀区清华园1号