发明名称 视频选择器
摘要 本发明提供了一种在视频会议中选择输入视频信号以进行发送的方法。所述方法将选择判定基于参与者的瞬时语音活动,但是这样做的同时还观察目的如下的约束:·增强每一个参与者所看到的图像的稳定性;·减少图像的闪烁;·在不同图像配置中选择令人舒适的并且有帮助的交换时间;以及·反映归因于在自然会议中具有较高的过往平均活动的人员的重要性。在本发明的一个实施例中,约束集合包括超控,通过超控可以选择一个或更多参与者而不论选择判定如何。根据本发明的第二方面,提供了一种视频选择器硬件,包括执行所述方法的步骤的单元。
申请公布号 CN102077586B 申请公布日期 2013.05.01
申请号 CN200980124220.2 申请日期 2009.06.11
申请人 谷歌公司 发明人 亨利克·艾尔纳
分类号 H04N7/15(2006.01)I 主分类号 H04N7/15(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 赵伟
主权项 一种用于在视频会议中选择输入视频信号的方法,包括以下步骤:从用户接收对所述选择的定量属性进行定义的参数集合的值;连续接收至少一个输入视频信号;针对每一个输入视频信号,接收相关联的输入音频信号,并且执行递归语音活动检测VAD,所述VAD向每一个输入视频信号分配二进制值,其中值1意味着检测到语音活动,值0意味着未检测到语音活动;确定至少包括以下约束在内的约束集合:稳定性约束、防闪烁约束、交换时间约束和优选约束;选择被分配以值1的输入视频信号以进行发送,并且不选择对被分配以值0的输入视频信号,除非这样做将违反所述约束集合中的至少一个约束;其中,稳定性约束规定:在至少C个连续VAD期间,首先,任何先前已选择的输入视频信号应当保持已选择;其次,任何先前未选择的信号应当保持未选择;其中,防闪烁约束规定:在两个连续VAD之间,从先前已选择变为未选择或从先前未选择变为已选择的输入视频信号的总数不应超过N;其中,交换时间约束规定:除非在S个连续VAD中将值0分配给输入视频信号,否则不应当取消对先前已选择的输入视频信号的选择;以及其中,优选约束规定:如果任何输入视频信号已经与累积语音活动的M个最大值相关联,则这些输入视频信号应当保持已选择,其中累积语音活动基于最新的VAD输出,其中,C、N、S和M是根据对所述选择的定量属性进行定义的参数集合的值;以及连续发送被选择进行发送的输入视频信号。
地址 美国加利福尼亚州