发明名称 机器人声源定位学中视觉示教声源角度的方法
摘要 本发明公开了一种机器人声源定位学中的视觉示教声源角度的方法,其步骤是:将云台正前方与机器人正前方进行校准;在机器人平台的合适位置安装麦克风阵列;构造视觉示教板,构造一个能够学非线性函数的学机,用于声源角度学;选定一个需要示教的空间位置,点声源持续发声,控制摄像头的云台运动,令示教板的几何图形的几何中心位于摄像头感知区域的中心,将此时云台的方位角和俯仰角作为声源相对于机器人的方位角和俯仰角;将多个相对时延值声源定位学机的输入值,将声源相对于机器人的方位角和俯仰角作为声源定位学机的目标值,对声源定位学机进行训练。本发明可以为声源定位学机的在线学提供声源角度。
申请公布号 CN106597378A 申请公布日期 2017.04.26
申请号 CN201611216416.2 申请日期 2016.12.26
申请人 大连民族大学 发明人 刘冠群;张汝波;杨大伟;唐莉莉;于海洋;蔺蘭;吴俊伟;毛琳;温乃峰
分类号 G01S5/22(2006.01)I;H04N5/232(2006.01)I 主分类号 G01S5/22(2006.01)I
代理机构 大连智高专利事务所(特殊普通合伙) 21235 代理人 毕进
主权项 一种机器人声源定位学习中视觉示教声源角度的方法,其特征在于,包括如下步骤:(1)将具有云台的摄像机安装在机器人平台上,使得云台的方位角为0°时,摄像机的视线方向与机器人正前方重合,云台的俯仰角为0°时,摄像机的视线方向与水平面间的角度为0°;(2)在机器人平台上安装M个麦克风,构成麦克风阵列以拾取声音信号,至少存在一个麦克风与其它麦克风中的至少一个位于不同平面,其中M&gt;3;(3)构造视觉示教板,该视觉示教板上具有易于识别的规则平面几何图形,在所述规则平面图形的几何中心安装一个点声源;(4)构造一个能够学习非线性函数的学习机,该学习机具有I个输入,I是从M个不同的麦克风中取出2个麦克风的组合数,该学习机具有2个输出,分别对应点声源的方位角和俯仰角;(5)选定一个需要示教的空间位置,令视觉示教板具有规则平面几何图形的一面朝向摄像机,控制摄像头的云台运动,令视觉示教板的规则平面几何图形的几何中心位于摄像头感知区域的中心,此时云台的方位角β和俯仰角γ看作是声源相对于机器人的方位角和俯仰角;(6)令位于规则几何图形中心的点声源持续发声,利用数据采集卡对各麦克风感知到的信号进行采样,令采样点数为N点,记第i个麦克风所采集到的声音信号序列为s<sub>i</sub>[n],0≤i≤M‑1,0≤n≤N‑1;(7)从M个不同的声音信号序列中取出2个不同的序列S<sub>i</sub>[n]和S<sub>j</sub>[n],计算它们之间的时延τ<sub>ij</sub>,τ<sub>ij</sub>的数目与I相同;(8)将I个时延τ<sub>ij</sub>作为学习机的输入,方位角β和俯仰角γ作为目标值,构成训练样本对学习机进行训练;(9)重复步骤(5)‑(8),直至任务结束。
地址 116600 辽宁省大连市经济技术开发区辽河西路18号