发明名称 一种在智能移动设备上实现的乐器音频实时分割方法
摘要 本发明公开了一种在智能移动设备上实现的乐器音频实时分割方法,该方法能够在移动设备上实现了录音和分割的同步操作。为了达到实时的效果,本发明在进行了快速预处理以后,通过计算定长窗口内信号的短时能量以及寻找能量均值的突变来确定真实跳变点的存在,使得边采集边处理成为可能。对于乐器发声的音频信号,本发明可以在用户弹奏乐器的同时,对采集到的音频信号进行分割,并快速显示,为用户进行音频识别、获取语义结构化信息、进行音频检索等深层处理做准备。
申请公布号 CN105227763A 申请公布日期 2016.01.06
申请号 CN201510549631.3 申请日期 2015.08.31
申请人 武汉工程大学 发明人 冷娇娇;赵彤洲;方晖;李翔;李碧;翟畅
分类号 H04M1/725(2006.01)I;G10L21/0272(2013.01)I 主分类号 H04M1/725(2006.01)I
代理机构 湖北武汉永嘉专利代理有限公司 42102 代理人 唐万荣
主权项 一种在智能移动设备上实现的乐器音频实时分割方法,其特征在于,包括以下步骤:1)采集音频数据:由移动通讯设备上的录音设备实时获取乐器的音频数据;2)前端静音消除:消除采集的音频数据中开始部分的静音数据;3)对消除静音数据后的音频数据进行实时处理,具体包括:3.1)预加重数字滤波:对经过前端静音消除处理的音频信号进行预加重处理和数字滤波;3.2)分帧:采用交替分帧方法对连续的分帧进行平滑过渡;3.3)计算短时能量:对分帧后的每一帧信号,计算短时能量E:<img file="FDA0000793438590000011.GIF" wi="318" he="170" />其中参数n为窗口长度,x(m)为信号序列;3.4)背景音消除:若帧信号能量值低于音频信号最大能量的0.1倍时,该帧信号为背景音,将背景音删除;3.5)查询分割点:对每相邻3帧的能量均值<img file="FDA0000793438590000013.GIF" wi="56" he="62" />进行比较,如果存在较大差距,则认为存在突变点,突变点为分割点,即满足:<img file="FDA0000793438590000012.GIF" wi="301" he="80" />其中,Th为判断前后相邻3帧的阈值系数;4)根据分割点所在的位置实现的乐器音频实时分割。
地址 430074 湖北省武汉市洪山区雄楚大街693号