发明名称 基于语音特征判别的静音检测方法
摘要 本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel尺度倒谱系数;用二分类支持向量机对音频的复合特征加以判别,一类结果为正常语音,另一类为静音。本发明可以提高静音检测成功率,并能对一些特殊语音加以识别。本发明广泛适用于网络语音通话中,特别是在语音聊天、视频会议中具有广阔的市场前景。
申请公布号 CN100573663C 申请公布日期 2009.12.23
申请号 CN200610039696.4 申请日期 2006.04.20
申请人 南京大学 发明人 都思丹;薛卫;周余;孔令红;叶迎宪;赵康涟
分类号 G10L11/02(2006.01)I 主分类号 G10L11/02(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 代理人 陈 扬
主权项 1、一种基于语音特征判别的静音检测方法,其特征在于它包含以下步骤:(1)提取一帧音频数据的多门限过零率,并对其加权值求和,得到总过零率Z;(2)用多门限过零率加权和对静音进行预判,一帧音频数据的总过零率Z小于设定阈值Z0,判断其为静音,否则将该帧交由步骤(3)处理;(3)提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel尺度倒谱系数;(4)用二分类支持向量机对音频的复合特征加以判别,得到正常语音和静音两类结果,对于正常语音,压缩后传送到接收方,对于静音,只在部分帧中加入自适应噪声后压缩并传送到接收方。
地址 210093江苏省南京市汉口路22号