发明名称 一种语音混音处理方法及装置
摘要 本发明公开了一种语音混音处理方法及装置,用于实现对基于语音属性的语音的混音处理。所述方法包括:对接收到的语音信号进行解析,获得所述语音信号的信息,所述信息中包含所述语音信号的用户信息;将所述语音信号的用户信息与预设的用户信息对比,并将与所述预设的用户信息一致的用户信息所对应的语音信号确定为待混音的语音信号;对所述待混音的语音信号进行混音处理。采用本发明的方案,实现了多路混音系统中对语音信号进行混音的效果,预设用户为重要发言人,且要对预设用户进行优先混音处理,通过将重要发言人作为高优先级预先设定,并将预设的用户的发言内容通过混音处理清晰地播放出来,从而保证重要信息被多个用户同时听到。
申请公布号 CN103794216B 申请公布日期 2016.08.24
申请号 CN201410049034.X 申请日期 2014.02.12
申请人 能力天空科技(北京)有限公司 发明人 楼英明;魏洪钦
分类号 G10L21/02(2013.01)I 主分类号 G10L21/02(2013.01)I
代理机构 北京冠和权律师事务所 11399 代理人 朱健
主权项 一种语音混音处理方法,其特征在于,包括以下步骤:对接收到的语音信号进行解析,获得所述语音信号的信息,所述信息中包含所述语音信号的用户信息、能量值以及数据内容,所述用户信息包括用户身份标识ID、用户角色和用户发言次数;将所述语音信号的用户信息与预设的用户信息对比,并将与所述预设的用户信息一致的用户信息所对应的语音信号确定为待混音的语音信号;包括:将所述语音信号的用户身份标识ID与预设的用户身份标识ID对比,并将与所述预设的用户身份标识ID一致的用户身份标识ID所对应的语音信号确定为待混音的语音信号;或,将所述语音信号的用户角色与预设的用户角色对比,并将与所述预设的用户角色一致的用户角色所对应的语音信号确定为待混音的语音信号;当所述语音信号的用户身份标识ID与预设的用户身份标识ID不一致,或所述语音信号的用户角色与预设的用户角色不一致时,根据解析后获得的所述语音信号的用户发言次数选择语音信号;将选择的语音信号确定为待混音的语音信号;对所述待混音的语音信号进行混音处理。
地址 100083 北京市海淀区学院路30号科大天工大厦A座7层