发明名称 | 不利环境中的多信道语音检测 | ||
摘要 | 本发明提供了多信道源活动检测系统(例如,语音活动检测(VAD)系统)和采用目标音频源的空间定位的方法。所述方法包括步骤:通过至少两个麦克风(102、104)接收混音信号;通过快速傅立叶变换将接收混音信号变换到频域(110);将变换信号滤波以输出与源的空间特征对应的信号(120);对预定频率范围上的滤波信号绝对值平方求和(122);以及将总和与阈值比较以确定是否存在语音(124)。此外,滤波步骤包括用噪声频谱功率矩阵的逆(132)、信道传递函数比向量(130)和源信号频谱功率(128)乘以变换信号。 | ||
申请公布号 | CN100476949C | 申请公布日期 | 2009.04.08 |
申请号 | CN03820158.5 | 申请日期 | 2003.07.21 |
申请人 | 西门子共同研究公司 | 发明人 | R·V·巴兰;J·罗斯卡;C·博格安特 |
分类号 | G10L11/02(2006.01)I | 主分类号 | G10L11/02(2006.01)I |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 杨 凯;张志醒 |
主权项 | 1.一种用于确定混音信号中是否存在语音的方法,所述方法包括以下步骤:通过至少两个麦克风接收所述混音信号;将每个接收混音信号快速傅立叶变换到频域;将变换信号滤波以输出与源的空间特征对应的信号;对预定频率范围上的滤波信号绝对值平方求和;将总和与阈值比较以确定是否存在语音,其中如果所述总和大于或等于所述阈值,则存在语音,如果所述总和小于所述阈值,则不存在语音;以及确定所述阈值,该确定所述阈值的步骤包括:对所述至少两个麦克风上的变换信号绝对值平方求和;对预定频率范围上的求和变换信号求和以产生第二总和;以及用提高因子乘以所述第二总和。 | ||
地址 | 美国新泽西州 |