发明名称 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
摘要 本发明公开了一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法。该方法主要包括:对麦克风采集到的信号进行截短,并进行快速傅里叶变换;利用相位调整算法对幅值谱进行微距最大值搜索,获得调整后的带噪语音的幅值谱;估计噪声的幅值谱;将全频带划分成多个子频带,并计算各个子频带上的信噪比;在各子频带上进行过减规则的幅值谱减法;对谱减后的语音谱进行幅值补偿;利用快速傅里叶反变换和信号重叠,得到信号的时域波形。
申请公布号 CN103021420A 申请公布日期 2013.04.03
申请号 CN201210513075.0 申请日期 2012.12.04
申请人 中国科学院自动化研究所 发明人 刘文举;李超
分类号 G10L21/0232(2013.01)I 主分类号 G10L21/0232(2013.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 1.一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法,其特征在于,包括下列步骤:步骤a:采集带噪语音信号y(k),获得所述带噪语音信号y(k)的幅值谱α<sub>y</sub>(ω),其中,k表示离散时间点,ω表示离散频点;步骤b:利用相位调整算法对带噪语音的幅值谱进行微距最大值搜索,获得纯净语音信号与加性噪声信号之间的相位差为0时的带噪语音幅值谱<img file="FDA00002521722600011.GIF" wi="161" he="71" />步骤c:利用噪声估计算法更新加性噪声幅值谱<img file="FDA00002521722600012.GIF" wi="156" he="62" />步骤d:利用过减规则系数和加性噪声幅值谱<img file="FDA00002521722600013.GIF" wi="131" he="62" />对所述带噪语音幅值谱<img file="FDA00002521722600014.GIF" wi="137" he="71" />进行幅值谱减,得到纯净语音幅值谱<img file="FDA00002521722600015.GIF" wi="156" he="77" />步骤e:利用二阶幅值补偿因子和预设的一阶幅值补偿因子,对纯净语音幅值谱<img file="FDA00002521722600016.GIF" wi="133" he="62" />进行补偿,得到增强后的纯净语音幅值谱<img file="FDA00002521722600017.GIF" wi="158" he="70" />进而得到增强后的纯净语音信号<img file="FDA00002521722600018.GIF" wi="131" he="68" />
地址 100190 北京市海淀区中关村东路95号