发明名称 一种基于音频特征的数字音频延展方法
摘要 本发明提供了一种基于音频特征的数字音频延展方法,在数字音频时域延展前,根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段,保证插入操作后音频片段之间自然衔接。在插入操作后,通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展,重复进行至达到延展要求,最大限度地降低音频延展对于音频质量的影响,保证整首乐曲在延展后的播放效果,由于乐曲在被延展后听觉效果与原乐曲接近,没有破坏乐曲的欣赏性。
申请公布号 CN102855883A 申请公布日期 2013.01.02
申请号 CN201110177195.3 申请日期 2011.06.28
申请人 清华大学 发明人 王朝坤;王建民;汪浩;刘璋
分类号 G10L21/04(2013.01)I 主分类号 G10L21/04(2013.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种基于音频特征的数字音频延展方法,其特征在于,所述方法包括:将原始数字音频文件按照预设标准进行分段,得到以段落为单位记录乐曲信息的数据;根据段落间的相似性对段落分类;选取合适的连续段落插入原乐曲,使其达到用户需求时长的80%到120%;对于插入后的乐曲,选取抗性符合预设需求的段落,对该段落进行长度的时域修改,并重复该步骤,直到达到用户需求时长。
地址 100084 北京市海淀区清华园一号