发明名称 用于音频/图像的说话者检测和定位的方法和装置
摘要 一种用于电视会议系统的方法和装置,其采用包括两个麦克风的阵列和一个静止照相机来自动地找出说话者的位置并电操作视频图像以产生可动的平移-倾斜-缩放(“PTZ”)照相机的效果。采用计算机视觉算法来检测、定位和追踪处于广角的静止照相机的视场中的人物。采用从只包括两个水平间隔开的麦克风的麦克风阵列中得到的估计声延迟来选择正在说话的人。此系统还可检测任何可能的模糊性,在这种情况下系统可以安全可靠的方式作出响应,例如它可以缩小以将处于同一水平位置的所有说话者包括在内。
申请公布号 CN1460185A 申请公布日期 2003.12.03
申请号 CN02800828.6 申请日期 2002.03.15
申请人 皇家菲利浦电子有限公司 发明人 A·科尔梅纳雷兹;H·J·斯特鲁贝;S·古塔
分类号 G01S3/782;H04N5/232;H04N7/15;G01S3/808 主分类号 G01S3/782
代理机构 中国专利代理(香港)有限公司 代理人 章社杲
主权项 1.一种电视会议系统(100),包括:用于产生代表了图像的图像信号的摄像装置(210);用于产生代表了来自声源的声音的音频信号的拾音装置(230);和用于处理所述图像信号和所述音频信号以确定所述声源相对于基准点的方向的多模式集成体系结构系统(270)。
地址 荷兰艾恩德霍芬