发明名称 一种音频中人声突出处理的方法及装置
摘要 本发明公开了一种音频中人声突出处理的方法及装置,其中,该方法包括:对音频信号进行分帧处理,以得到各个音频帧信号;对得到的音频帧信号进行分组,每N个音频帧信号分为一组,分析每一分组中音频帧信号的频带范围、频带能量、低能量帧率及过零率的特性,并根据每一分组对应的分析结果,确定每一分组音频帧信号中是否有人声,N取大于1的正整数;若有分组音频帧信号中有人声,则对该分组的音频帧信号进行带通滤波,以输出滤波后的第一音频信号。采用本发明,可方便准确的识别人声并对识别出的人声进行突出。
申请公布号 CN104916288A 申请公布日期 2015.09.16
申请号 CN201410096336.2 申请日期 2014.03.14
申请人 深圳TCL新技术有限公司 发明人 高伟标;何文辉;刘飞祥;朱生林
分类号 G10L21/02(2013.01)I;G10L21/0272(2013.01)I;G10L19/02(2013.01)I;G10L17/00(2013.01)I 主分类号 G10L21/02(2013.01)I
代理机构 深圳市世纪恒程知识产权代理事务所 44287 代理人 胡海国
主权项 一种音频中人声突出处理的方法,其特征在于,该方法包括:对音频信号进行分帧处理,以得到各个音频帧信号;对得到的音频帧信号进行分组,每N个音频帧信号分为一组,分析每一分组中音频帧信号的频带范围、频带能量、低能量帧率及过零率的特性,并根据每一分组对应的分析结果,确定每一分组音频帧信号中是否有人声,N取大于1的正整数;若有分组音频帧信号中有人声,则对该分组的音频帧信号进行带通滤波,以输出滤波后的第一音频信号。
地址 518052 广东省深圳市南山区中山园路1001号TCL国际E城科技大厦D4栋7楼