发明名称 支持大容量混音的同声传译视频会议系统及方法
摘要 本发明公开了一种支持大容量混音的同声传译视频会议系统及方法,提出了基于Mel尺度倒谱特征与支持向量机静音检测方法、大容量混音方法和同声传译方法。可以实现更高的静音检测率、比其它混音方法更多的混音路数和在同一会议室进行多语种同步混音。静音检测方法以Mel尺度倒谱系数为语音特征,二分类支持向量机为分类器判断出静音和正常语音;混音方法采用语音的短时能量作为权重处理依据;多语种同步混音通过定义新的音频数据包头格式实现。
申请公布号 CN1845573A 申请公布日期 2006.10.11
申请号 CN200610040060.1 申请日期 2006.04.30
申请人 南京大学 发明人 都思丹;薛卫;周余;叶迎宪;刘红星
分类号 H04M3/56(2006.01) 主分类号 H04M3/56(2006.01)
代理机构 代理人
主权项 1、一种支持大容量混音的同声传译视频会议系统及方法,其特征在于它包含:(1)支持大容量混音的方法,通过基于Mel尺度倒谱特征与支持向量机静音检测方法抑制发言端静音的传送和在多点控制单元混音器中使用短时自适应权重混音方法。(2)同一会议室进行多语种同步混音,定义了新的音频数据包头格式,及在一个会议室使用多个混音过程。
地址 210093江苏省南京市鼓楼区汉口路22号