发明名称 |
一种语音降噪方法 |
摘要 |
本发明公开了一种语音降噪方法,涉及语音降噪领域,通过采用语音端点检测,获取到语音段的起始和终止位置,并通过在无语音段时实时更新噪声谱的方式跟踪噪声的变化,由于在语音段总是采用之前最新更新的噪声谱进行功率谱相减,因此能够最大限度减小噪声不断缓慢变化所带来的误差;同时在语音动态检测后设置了噪声最短长度限制,最大程度的避免了在连续语音段中将语音误检为噪声,造成对噪声平均功率谱统计错误的情况,从而进一步地获取到更准确的语音信号,提高输出信号的信噪比,满足了实际应用中的需要。 |
申请公布号 |
CN101866652A |
申请公布日期 |
2010.10.20 |
申请号 |
CN201010169091.3 |
申请日期 |
2010.05.11 |
申请人 |
天津大学 |
发明人 |
张涛;李海;张雯;赵亮;冯砚儒 |
分类号 |
G10L21/02(2006.01)I;G10L11/02(2006.01)I |
主分类号 |
G10L21/02(2006.01)I |
代理机构 |
天津市北洋有限责任专利代理事务所 12201 |
代理人 |
温国林 |
主权项 |
一种语音降噪方法,其特征在于,所述方法包括以下步骤:(1)将输入的信号按照分帧规则进行分帧;(2)判断当前帧的开始是否为一段语音信号的起始点,如果是,执行步骤(3);如果否,更新起始点之前的噪声平均功率谱,并准备处理下一帧,执行步骤(2);(3)获取当前帧混合信号的功率谱;(4)根据步骤(2)中获取到的噪声平均功率谱和步骤(3)中获取到的混合信号的功率谱,获取纯净语音信号的功率谱,获取并输出时域波形,并准备处理下一帧;(5)判断当前帧的开始是否为语音信号的终止点,如果是,执行步骤(6);如果否,执行步骤(3);(6)清空上次计算噪声平均功率谱过程中得到的N×Frame_Length长度缓冲区中的数据,执行步骤(9),其中,N为帧的数量,Frame_Length为一帧采样点数;(7)判断当前帧开始是否为语音信号的起始点,如果是,执行步骤(8);如果否,执行步骤(9);(8)判断无语音段是否达到固定长度N×Frame_Length,如果是,使用当前更新得到的噪声平均功率谱,执行步骤(3);如果否,将上一无语音段中获取到的噪声平均功率谱作为当前的噪声平均功率谱,执行步骤(3);(9)将所有的N帧数据左移一帧,将当前帧作为第N帧数据,更新噪声平均功率谱,并准备处理下一帧,执行步骤(7)。 |
地址 |
300072 天津市南开区卫津路72号 |