发明名称 一种基于AVS和稀疏表示的单语者声源DOA估计方法
摘要 本发明提供了一种基于AVS和稀疏表示的单语者声源DOA估计方法。所述方法采用声学矢量传感器(Acoustic Vector Sensor,AVS)实现音频信号采集,利用语音信号的时频稀疏特性和AVS接收分量之间的三角函数关系,采用正弦迹算法提取高信噪比时频点,计算压力梯度传感器与全向压力传感器间的数据比。在此基础上,利用声源的空间稀疏特性,获得传感器间数据比的过完备字典稀疏表示模型,将语者声源到达方向(Direction ofArrival,DOA)估计问题转化为稀疏矢量求解问题。采用l1-SVD方法求解稀疏矢量,计算其空间功率谱,计算得到语音声源的DOA。本发明所述方法在不同的噪声强度和房间混响条件下,能够准确地估计出语者声源的DOA。此外,该方法采用的麦克风阵列体积小(仅有1cm<sup>3</sup>),非常适用于便携设备上的语音技术。
申请公布号 CN103760520A 申请公布日期 2014.04.30
申请号 CN201310726022.1 申请日期 2013.12.25
申请人 北京大学深圳研究生院 发明人 邹月娴;郭轶凡;石伟
分类号 G01S3/802(2006.01)I 主分类号 G01S3/802(2006.01)I
代理机构 代理人
主权项 一种基于AVS和稀疏表示的单语者声源DOA估计方法,包括如下步骤:a)采用单个AVS(Acoustic Vector Sensor),即声学矢量传感器,和模数转换器实现语音信号采集,获得四通道数字信号输出。分别对各通道输出信号进行加窗分帧和短时傅里叶变换,获得四个通道的时频谱数据。b)采用正弦迹算法对(a)所得时频谱数据提取高信噪比时频点,记为L个。c)对由步骤(b)提取的L个高信噪比时频点分别求出AVS三个梯度传感器与全向传感器之间的频谱数据比(Inter‑Sensor Data Ratio,ISDR),记为ISDR值,I<sub>uo</sub>(τ,ω),I<sub>vo</sub>(τ,ω),I<sub>wo</sub>(τ,ω)。用ISDR值构成3×1的ISDR数据矢量I(τ,ω)。d)将整个空间均匀离散为M个网格,用离散的虚拟角度集合将AVS阵列流形矩阵构建出过完备字典,并对步骤(c)中的每一个时频点上的数据矢量I(τ,ω)进行稀疏表示。e)利用l1‑SVD方法对(d)中的稀疏模型求解稀疏矢量,并计算平均空间功率谱以及峰值所对应声源的到达方向(Direction ofArrival,DOA)。
地址 518055 广东省深圳市南山区西丽大学城北大园区