基于语音特征判别的静音检测方法,申请号CN200610039696.4-传众专利搜索

发明名称	基于语音特征判别的静音检测方法
摘要	本发明公开了一种基于语音特征识别的静音检测方法，首先提取一帧音频数据的多门限过零率；用加权多门限过零率对静音进行预判，判别出明显的静音；提取一帧音频数据的复合特征，复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel尺度倒谱系数；用二分类支持向量机对音频的复合特征加以判别，一类结果为正常语音，另一类为静音。本发明可以提高静音检测成功率，并能对一些特殊语音加以识别。本发明广泛适用于网络语音通话中，特别是在语音聊天、视频会议中具有广阔的市场前景。
申请公布号	CN100573663C	申请公布日期	2009.12.23
申请号	CN200610039696.4	申请日期	2006.04.20
申请人	南京大学	发明人	都思丹;薛卫;周余;孔令红;叶迎宪;赵康涟
分类号	G10L11/02(2006.01)I	主分类号	G10L11/02(2006.01)I
代理机构	南京苏高专利商标事务所(普通合伙）	代理人	陈扬
主权项	1、一种基于语音特征判别的静音检测方法，其特征在于它包含以下步骤：(1)提取一帧音频数据的多门限过零率，并对其加权值求和，得到总过零率Z；(2)用多门限过零率加权和对静音进行预判，一帧音频数据的总过零率Z小于设定阈值Z0，判断其为静音，否则将该帧交由步骤(3)处理；(3)提取一帧音频数据的复合特征，复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel尺度倒谱系数；(4)用二分类支持向量机对音频的复合特征加以判别，得到正常语音和静音两类结果，对于正常语音，压缩后传送到接收方，对于静音，只在部分帧中加入自适应噪声后压缩并传送到接收方。
地址	210093江苏省南京市汉口路22号