发明名称 用于活跃的说话者探测的视频和音频标记
摘要 描述了一种视频会议系统,其被配置成选择活跃的说话者而避免错误地选择正在拾取来自于连接的远程信号的音频或视频的话筒或相机。做出音频信号是否在阈值水平之上的确定。如果是,则做出关于该音频信号中是否存在标记的确定。如果是,则忽略该信号。如果不是,相机被导向由音频信号所识别的声音源。做出来自该相机的视频信号中是否存在标记的确定。如果是,重定向相机。如果不是,(多个)本地标记被插入音频信号和/或视频信号中。发射(多个)加标记的信号。因此,系统将忽略具有来自另一视频会议系统的嵌入的标记的声音或视频。
申请公布号 CN104937926A 申请公布日期 2015.09.23
申请号 CN201380066894.8 申请日期 2013.12.19
申请人 微软技术许可有限责任公司 发明人 W.G.韦泰因;S.莱奥林
分类号 H04N7/15(2006.01)I 主分类号 H04N7/15(2006.01)I
代理机构 中国专利代理(香港)有限公司 72001 代理人 初媛媛;景军平
主权项 一种用于视频会议系统的发射器系统,包括:产生音频标记或视频标记中的至少一个的标记产生器;用于以下二者中的至少一个的组合器:(i)将接收到的音频信号与所述音频标记组合以产出加标记的音频信号或(ii)将接收到的视频信号与所述视频标记组合以产出加标记的视频信号;以及发射器,用于发射(i)所述加标记的音频信号和所述接收到的视频信号、(ii)所述接收到的音频信号和所述加标记的视频信号、或者(iii)所述加标记的音频信号和所述加标记的视频信号。
地址 美国华盛顿州