发明名称 一种音频信号分类方法和装置
摘要 本发明实施例公开了一种音频信号分类方法和装置,用于对输入的音频信号进行分类,该方法包括:根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中,其中,所述频谱波动表示音频信号的频谱的能量波动;根据音频帧是否为敲击音乐或历史音频帧的活动性,更新频谱波动存储器中存储的频谱波动;根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量,将所述当前音频帧分类为语音帧或者音乐帧。
申请公布号 CN104347067B 申请公布日期 2017.04.12
申请号 CN201310339218.5 申请日期 2013.08.06
申请人 华为技术有限公司 发明人 王喆
分类号 G10L15/08(2006.01)I;G10L19/13(2013.01)I;G10L25/51(2013.01)I 主分类号 G10L15/08(2006.01)I
代理机构 代理人
主权项 一种音频信号分类方法,其特征在于,包括:根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中,其中,所述频谱波动表示音频信号的频谱的能量波动;根据音频帧是否为敲击音乐或历史音频帧的活动性,更新频谱波动存储器中存储的频谱波动;根据频谱波动存储器中存储的频谱波动的部分或全部有效数据的统计量,将所述当前音频帧分类为语音帧或者音乐帧;其中,所述根据当前音频帧的声音活动性,确定是否获得当前音频帧的频谱波动并存储于频谱波动存储器中包括:若当前音频帧为活动帧,且包含当前音频帧与其历史帧在内的多个连续帧都不属于能量冲击,则将音频帧的频谱波动存储于频谱波动存储器中。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼