发明名称 一种语音识别场景中回音消除的方法
摘要 本发明属于语音识别领域,提供一种语音识别场景中回音消除的实施方法,该方法使用双数字麦克风通道,在音频数字信号处理模块中同时获得麦克输入和扬声器输出音频数据,将其中的扬声器输出右声道数据复制到麦克输入音频数据的右声道中,形成合成的麦克输入音频数据,将合成的麦克输入音频数据提供给上层的回音消除模块,通过回音消除模块AEC对合成的麦克输入音频数据的左右声道进行算法处理,输出可供语音识别模块使用的语音输入音频数据,让设备能够识别外界语音指令。本发明方法能够有效减低设备自身播放的音频对设备语音识别功能的干扰,从而让设备更加准确地识别外界语音指令,增强人机语音交互的操作体验。
申请公布号 CN106297815A 申请公布日期 2017.01.04
申请号 CN201610598402.5 申请日期 2016.07.27
申请人 武汉诚迈科技有限公司 发明人 赵成义;何川
分类号 G10L21/02(2013.01)I;G10L21/0208(2013.01)I;G10L15/22(2006.01)I 主分类号 G10L21/02(2013.01)I
代理机构 武汉天力专利事务所 42208 代理人 吴晓颖
主权项 一种语音识别场景中回音消除的方法,其特征在于:该方法在硬件方面的预置条件为:音频输入为两个数字麦克,在物理电路上,连接数字麦克1,不连接数字麦克2,即数字麦克2虚焊,不连接真实的数字麦克;音频输出为一个扬声器;在软件方面的预置条件为:AEC算法需要使用两种音频数据,分别是从麦克录制的麦克输入音频数据和从扬声器播放的扬声器输出音频数据,要求录制音频必须使用双声道的录制方法;具体的该方法步骤如下:(1)将双声道合成算法加载到音频数字信号处理模块中,该算法将数字麦克1输入的录制音频和将多媒体应用程序输出到扬声器的播放音频合成一种双声道音频,将其中的扬声器输出音频数据复制到麦克输入音频数据的右声道中,在这种合成的音频中左声道为麦克输入的音频,右声道为扬声器输出的音频;(2)在麦克输入音频处理软件模块中,将根据其上层回音消除AEC软件模块中AEC算法的需求对合成的麦克输入音频进行调整,特别需要调整右声道中的扬声器输出的音频数据的音量;(3)在回音消除AEC软件模块获得了合成的双声道音频以后,使用音频分解算法,分解出左声道音频麦克输入音频和右声道音频扬声器输出音频,作为两路独立的单声道音频传入到AEC算法中,通过AEC算法处理以后,输出清晰的语音音频,并将其提供给语音识别软件模块进行语音识别处理。
地址 430074 湖北省武汉市东湖新技术开发区关山大道一号光谷软件园A2栋4楼