发明名称 声源分离装置、方法和程序
摘要 传统的独立分量分析存在声源数量超过麦克风数量时性能变差的问题。传统的l1范最小化方法假设除声源以外不存在噪声,在存在语音以外的噪声比如回声和混响的环境中存在性能变差的问题。除了采用l1范最小化方法分离声音的时候用作费用函数的l1范以外,本发明还将噪声分量的功率当作费用函数。在这种l1范最小化方法中,在语音与时间方向无关的假设下定义费用函数。但是,在本发明中,在语音与时间方向有关的假设下定义费用函数,并且因为其结构,很容易选择与时间方向有关的解。
申请公布号 CN101030383A 申请公布日期 2007.09.05
申请号 CN200710002400.6 申请日期 2007.01.15
申请人 株式会社日立制作所 发明人 户上真人;天野明雄;住吉贵志
分类号 G10L21/02(2006.01);G10L11/04(2006.01);G10L19/00(2006.01) 主分类号 G10L21/02(2006.01)
代理机构 永新专利商标代理有限公司 代理人 王英
主权项 1.一种声源分离装置,包括:A/D转换单元,用于将模拟信号转换为数字信号,该模拟信号来自具有M个麦克风的麦克风阵列,其中M个麦克风包括至少两个麦克风;频带分割单元,用于对所述数字信号进行频带分割,以转换为频域输入;误差最小解计算单元,对于每个频带,该误差最小解计算单元具有超过所述数量M的声源的矢量,具有从1到等于所述数量M的声源的矢量,并且该误差最小解计算单元输出解集,该解集在根据声源1到M的所述矢量和预定导引矢量计算出来的估计信号和所述频域输入之间具有最小误差;最优模型计算部件,用于为所述误差最小解集之中的每个频带选择频域解,该频域解具有最小的lp范数与所述误差的加权和;以及信号合成单元,用于将所选频域解转换到时域。
地址 日本东京都