发明名称 |
激活音检测及用于激活音检测的方法和装置 |
摘要 |
本发明涉及一种激活音检测(VAD)及用于激活音检测的方法和装置,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数和谱重心特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。本发明方法和装置可提高不稳定噪声(如办公室噪声)和音乐检测的准确率。 |
申请公布号 |
CN103903634A |
申请公布日期 |
2014.07.02 |
申请号 |
CN201210570563.5 |
申请日期 |
2012.12.25 |
申请人 |
中兴通讯股份有限公司 |
发明人 |
江东平;袁浩;朱长宝 |
分类号 |
G10L25/93(2013.01)I;G10L21/0208(2013.01)I |
主分类号 |
G10L25/93(2013.01)I |
代理机构 |
北京安信方达知识产权代理有限公司 11262 |
代理人 |
田红娟;龙洪 |
主权项 |
一种激活音检测(VAD)方法,其特征在于,该方法包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的帧能量参数、谱重心特征参数和时域稳定度特征参数的值;根据频谱幅值计算得到谱平坦度特征参数和调性特征参数的值;根据前一帧估计得到的背景噪声能量、当前帧的帧能量参数及信噪比子带能量计算得到当前帧的信噪比参数;根据当前帧帧能量参数、谱重心特征参数、时域稳定度特征参数、谱平坦度特征参数、调性特征参数计算得到当前帧的调性标志;根据调性标志、信噪比参数、谱重心特征参数、帧能量参数计算得到VAD判决结果。 |
地址 |
518057 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部 |