发明名称 采用感知模型的语音增强
摘要 公开了一种基于心理声学模型的语音增强,所述语音增强能够保留语音的保真度同时充分地抑制包含被称为“音乐噪声”的对人工产物的处理的噪声。
申请公布号 CN101636648B 申请公布日期 2012.12.05
申请号 CN200880008865.5 申请日期 2008.03.14
申请人 杜比实验室特许公司 发明人 俞容山
分类号 G10L21/02(2006.01)I;G10L19/02(2006.01)I 主分类号 G10L21/02(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 魏小薇
主权项 一种用于增强由语音分量和噪声分量构成的音频信号的语音分量的方法,包括:将所述音频信号从时域变换为频域中的多个子带,处理所述音频信号的子带,所述处理包含响应控制而自适应地降低所述子带中的一些子带的增益,其中,至少部分地从所述子带中的所述一些子带中的音频信号的噪声分量的幅度的估计得出所述控制,并且其中,所述增益使代价函数最小化,所述代价函数包含语音畸变项和可感知噪声项,其中所述语音畸变项与所述可感知噪声项的相对重要性由加权因子确定,所述语音畸变项是从施加增益前后的语音分量幅度的log之间的差值得到的,所述可感知噪声项是从掩蔽阈值的log和施加增益之后的估计的噪声分量幅度的log之间的差值得到的,和将处理后的音频信号从频域变换成时域以提供语音分量被增强的音频信号。
地址 美国加利福尼亚