发明名称 基于多带谱减法的非空气传导语音增强方法
摘要 本发明公开了一种基于多带谱减法的非空气传导语音增强方法,由于基于雷达的非空气传导语音中的噪声往往是有色的,并且不会在整个频谱范围内均匀地影响语音信号,因此本发明提出将语音频谱有针对性地分为互不重叠的五段,同时分别为每一段设计独自的谱减系数,从而实现算法的有效性和较强的针对性。采用这种方法的实例表明,这种新型非空气传导语音增强方法能够有效弥补传统语音增强方法针对性不强的弱点,且执行效率高、算法简单易行,效果明显,因此具有较强的实用价值和应用前景。
申请公布号 CN101320566B 申请公布日期 2010.10.20
申请号 CN200810150205.2 申请日期 2008.06.30
申请人 中国人民解放军第四军医大学 发明人 李盛;王健琪;荆西京;牛明
分类号 G10L21/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 西安通大专利代理有限责任公司 61200 代理人 张震国
主权项 基于多带谱减法的非空气传导语音增强方法,其特征在于:1)对雷达非空气传导语音做A/D转换,进行数字化处理,其采样速率为10KHz~20KHz;2)对数字化后的雷达语音进行有语音段信号及无语音段噪声信号判别;3)对上述雷达语音中的无语音段噪声信号进行采集,得到长度大于10帧即200~400ms的无语音段噪声信号,取每帧256~512点,设定帧间重叠率介于25%~75%间,并进行噪声平均估计;4)对该无语音段噪声信号做傅立叶变换,再取频谱幅值的平方得到噪声功率谱估计值;5)对上述雷达语音中的有语音段信号做分帧处理,取每帧256~512点,并设定帧间重叠率介于25%~75%间,再对每帧语音数据做傅立叶变换进行频谱分析,并取频谱幅值的平方得到带噪语音的功率谱估计值;6)将语音和噪声频谱分为五个频段,分别是:0~300Hz(Band 1),300~1KHz(Band 2),1K~2K(Band 3),2K~3K(Band 4),3K~5K(Band5);7)对于处于各个频段内的噪声功率谱进行加权,并用带噪语音的功率谱减去加权后的噪声功率谱,从而得到纯净语音的功率谱估计值;8)将带噪语音的频谱相位作为增强后语音频谱相位的估计值,再将语音信号做反变换,从而得到处理后的语音信号。
地址 710038 陕西省西安市长乐中路17号