一种基于AVS和稀疏表示的单语者声源DOA估计方法,申请号CN201310726022.1-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种基于AVS和稀疏表示的单语者声源DOA估计方法
摘要	本发明提供了一种基于AVS和稀疏表示的单语者声源DOA估计方法。所述方法采用声学矢量传感器(Acoustic Vector Sensor，AVS)实现音频信号采集，利用语音信号的时频稀疏特性和AVS接收分量之间的三角函数关系，采用正弦迹算法提取高信噪比时频点，计算压力梯度传感器与全向压力传感器间的数据比。在此基础上，利用声源的空间稀疏特性，获得传感器间数据比的过完备字典稀疏表示模型，将语者声源到达方向(Direction ofArrival，DOA)估计问题转化为稀疏矢量求解问题。采用l1-SVD方法求解稀疏矢量，计算其空间功率谱，计算得到语音声源的DOA。本发明所述方法在不同的噪声强度和房间混响条件下，能够准确地估计出语者声源的DOA。此外，该方法采用的麦克风阵列体积小(仅有1cm<sup>3</sup>)，非常适用于便携设备上的语音技术。
申请公布号	CN103760520A	申请公布日期	2014.04.30
申请号	CN201310726022.1	申请日期	2013.12.25
申请人	北京大学深圳研究生院	发明人	邹月娴;郭轶凡;石伟
分类号	G01S3/802(2006.01)I	主分类号	G01S3/802(2006.01)I
代理机构		代理人
主权项	一种基于AVS和稀疏表示的单语者声源DOA估计方法，包括如下步骤：a)采用单个AVS(Acoustic Vector Sensor)，即声学矢量传感器，和模数转换器实现语音信号采集，获得四通道数字信号输出。分别对各通道输出信号进行加窗分帧和短时傅里叶变换，获得四个通道的时频谱数据。b)采用正弦迹算法对(a)所得时频谱数据提取高信噪比时频点，记为L个。c)对由步骤(b)提取的L个高信噪比时频点分别求出AVS三个梯度传感器与全向传感器之间的频谱数据比(Inter‑Sensor Data Ratio，ISDR)，记为ISDR值，I<sub>uo</sub>(τ，ω)，I<sub>vo</sub>(τ，ω)，I<sub>wo</sub>(τ，ω)。用ISDR值构成3×1的ISDR数据矢量I(τ，ω)。d)将整个空间均匀离散为M个网格，用离散的虚拟角度集合将AVS阵列流形矩阵构建出过完备字典，并对步骤(c)中的每一个时频点上的数据矢量I(τ，ω)进行稀疏表示。e)利用l1‑SVD方法对(d)中的稀疏模型求解稀疏矢量，并计算平均空间功率谱以及峰值所对应声源的到达方向(Direction ofArrival，DOA)。
地址	518055 广东省深圳市南山区西丽大学城北大园区

您可能感兴趣的专利

Mechanical coupler

Light emitting diode array

Liquid crystal display television

Wheel or wheel cover

Window for packaging

HDMI cable connector

Cushion support

Lounge furniture

Portion of an upper of a footwear article

Carousel organizer

Carousel organizer

DIAPHRAGM PUMPING UNIT

ANALYTICAL () METHOD FOR IDENTIFYING, DOSING ALBENDAZOLE AND THE CHEMICALLY RELATED IMPURITIES IN THE PHARMACEUTICAL PRODUCTS VERMICID 10, VERMICID 2.5 AND ALBENDAZOLE - ACTIVE PHARMACEUTICAL INGREDIENT

MUSICAL ARTESIAN WELL-MUSICAL ART SHOW

PYRAMID-TABLE FOR ENERGIZING LIQUIDS

dispositivos fotovoltaicos de conversão de luz em energia elétrica

célula de recipiente, particularmente célula de garrafa e cesta de recipientes com células de recipiente deste tipo