发明名称 发言人检测系统、发言人检测方法和音频/视频会议系统
摘要 一种发言人检测系统可以包括:摄像机,用于获取多个与会者的视频信息;麦克风,用于获取音频/视频会议的音频信息;处理模块,配置为对所述视频信息中的所述多个与会者中每一个的视觉语音活动分别进行检测,以生成针对所述多个与会者中每一个的视觉语音活动检测信号;并配置为对所述音频信息中的声学语音活动进行检测,以生成声学语音活动检测信号;比较模块,用于将所述视觉语音活动检测信号分别与所述声学语音活动检测信号进行比较,并将与所述声学语音活动检测信号具有最大相关度的视觉语音活动检测信号所对应的与会者确定为当前发言人。本发明还描述了一种相应的发言人检测方法以及一种合并了该发言人检测系统的音频/视频会议系统。
申请公布号 CN103581608A 申请公布日期 2014.02.12
申请号 CN201210252356.5 申请日期 2012.07.20
申请人 POLYCOM 通讯技术(北京)有限公司 发明人 李茂全
分类号 H04N7/15(2006.01)I;H04N7/14(2006.01)I;G10L25/51(2013.01)I 主分类号 H04N7/15(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 刘鹏;汪扬
主权项  一种基于视觉语音活动检测和声学语音活动检测的发言人检测系统,包括:摄像机,用于获取多个与会者的视频信息;麦克风,用于获取音频/视频会议的音频信息;处理模块,配置为对所述视频信息中的所述多个与会者中每一个的视觉语音活动分别进行检测,以生成针对所述多个与会者中每一个的视觉语音活动检测信号;并配置为对所述音频信息中的声学语音活动进行检测,以生成声学语音活动检测信号;比较模块,用于将所述视觉语音活动检测信号分别与所述声学语音活动检测信号进行比较,并将与所述声学语音活动检测信号具有最大相关度的视觉语音活动检测信号所对应的与会者确定为当前发言人。
地址 100027 北京市朝阳区新源南路3号A座25层