发明名称 语音信号的混音方法和装置
摘要 本发明公开了一种混音方法和一种混音装置,所述方法包括:设置混音时长,所述混音时长小于预设的人耳可承受语音延时对应的混音时长边界值,且大于各参混码流的帧长最大者;对于帧长与混音时长不存在整数倍关系的码流,根据动态拼包原则进行拼包处理,动态拼包原则为:针对同一终端本次参混后产生的码流,令n个拼包所包含的语音时长大于或等于混音时长与n的乘积。使用本发明能够减少混音引入的系统时延,提高视频会议系统的实时性。
申请公布号 CN102045461B 申请公布日期 2013.07.24
申请号 CN200910235813.8 申请日期 2009.10.09
申请人 杭州华三通信技术有限公司 发明人 毕永建;邓凌
分类号 H04M3/56(2006.01)I;H04N7/15(2006.01)I 主分类号 H04M3/56(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 王一斌;王琦
主权项 一种语音信号的混音方法,其特征在于,确定混音时长,所述混音时长小于预设的人耳可承受语音延时对应的混音时长边界值,且大于各参混码流的帧长最大者;混音过程包括:对各参混终端的码流进行拼包处理;所述拼包步骤包括:对于帧长与混音时长不存在整数倍关系的码流,以帧长的整数倍为拼包单位进行动态拼包处理;对于帧长与设定的混音时长存在整数倍关系的码流,以混音时长为单位进行拼包处理,得到的每个语音包包含一个混音时长的语音数据;具体动态拼包原则为:针对同一终端本次参混后产生的码流,如果能够满足第i个拼包所包含的语音时长与该码流前i‑1个拼包所包含的语音时长之和∑tpb等于混音时长与i的乘积∑thy的条件,则按照∑tpb=∑thy的关系构造第i个拼包;否则,按照∑tpb>∑thy且|∑tpb‑∑thy|小于该码流的一个帧长的关系构造第i个拼包;调用解码器对拼包后的码流进行解码,将解码获得的语音数据放入各参混终端对应的输入缓存通道;每个输入缓存通道的容量大于或等于一个混音时长的数据量,且能够容纳下任意一个拼包;从各输入缓存通道分别读取一个混音时长的语音数据进行混音处理,将混音得到的混音数据分别存入各终端对应的输出缓存通道;每个输出缓存通道的容量大于或等于一个混音时长的数据量,且能够容纳下任意一个拼包;调用编码器对各输出缓存通道中的混音数据进行编码组包处理;所述编码组包步骤包括:对于帧长与设定的混音时长不存在整数倍关系的码流,以帧长的整数倍为组包单位进行动态编码组包处理;对于帧长与设定的混音时长存在整数倍关系的码流,以混音时长为单位进行编码组包处理,得到的每个编码组包包含整数倍帧长的混音数据;具体动态编码组包原则为:针对同一终端本次参混后产生的码流,如果能够满足第i个编码组包所包含的语音时长与该码流前i‑1个编码组包所包含的语音时长之和∑tzb大于混音时长与i的乘积∑thy的条 件,则按照∑tzb=∑thy的关系构造第i个编码组包;否则,按照∑tzb<∑thy且|∑tzb‑∑thy|小于该码流的一个帧长的关系构造第i个编码组包。
地址 310053 浙江省杭州市高新技术产业开发区之江科技工业园六和路310号华为杭州生产基地