发明名称 不利环境中的多信道语音检测
摘要 本发明提供了多信道源活动检测系统(例如,语音活动检测(VAD)系统)和采用目标音频源的空间定位的方法。所述方法包括步骤:通过至少两个麦克风(102、104)接收混音信号;通过快速傅立叶变换将接收混音信号变换到频域(110);将变换信号滤波以输出与源的空间特征对应的信号(120);对预定频率范围上的滤波信号绝对值平方求和(122);以及将总和与阈值比较以确定是否存在语音(124)。此外,滤波步骤包括用噪声频谱功率矩阵的逆(132)、信道传递函数比向量(130)和源信号频谱功率(128)乘以变换信号。
申请公布号 CN100476949C 申请公布日期 2009.04.08
申请号 CN03820158.5 申请日期 2003.07.21
申请人 西门子共同研究公司 发明人 R·V·巴兰;J·罗斯卡;C·博格安特
分类号 G10L11/02(2006.01)I 主分类号 G10L11/02(2006.01)I
代理机构 中国专利代理(香港)有限公司 代理人 杨 凯;张志醒
主权项 1.一种用于确定混音信号中是否存在语音的方法,所述方法包括以下步骤:通过至少两个麦克风接收所述混音信号;将每个接收混音信号快速傅立叶变换到频域;将变换信号滤波以输出与源的空间特征对应的信号;对预定频率范围上的滤波信号绝对值平方求和;将总和与阈值比较以确定是否存在语音,其中如果所述总和大于或等于所述阈值,则存在语音,如果所述总和小于所述阈值,则不存在语音;以及确定所述阈值,该确定所述阈值的步骤包括:对所述至少两个麦克风上的变换信号绝对值平方求和;对预定频率范围上的求和变换信号求和以产生第二总和;以及用提高因子乘以所述第二总和。
地址 美国新泽西州