发明名称 娱乐音频中的语音增强
摘要 本发明涉及音频信号处理。更具体地,本发明涉及增强例如电视音频的娱乐音频以提高诸如对话或叙述音频的语音的清晰度和可懂度。本发明涉及方法、执行所述方法的设备、以及用于使得计算机执行所述方法的在计算机可读介质中存储的软件。
申请公布号 CN101647059A 申请公布日期 2010.02.10
申请号 CN200880009929.3 申请日期 2008.02.20
申请人 杜比实验室特许公司 发明人 H·米施
分类号 G10L11/02(2006.01)I;G10L21/02(2006.01)I;H04R25/00(2006.01)I 主分类号 G10L11/02(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 代理人 杨国权
主权项 1、一种用于增强娱乐音频中的语音的方法,包括:响应于一个或多个控制,处理所述娱乐音频以提高所述娱乐音频中的语音部分的清晰度和可懂度,以及生成对所述处理的控制,所述生成步骤包括:将所述娱乐音频的时间区段特征化为(a)语音或非语音或(b)可能是语音或非语音,以及响应于所述娱乐音频的电平的变化而提供对所述处理的控制,其中这种变化在比所述时间区段短的时间段中被响应,并且所述响应的判定准则由所述特征化步骤控制。
地址 美国加利福尼亚