发明名称 一种应用于电子耳蜗的语音处理方法
摘要 本发明提供一种应用于电子耳蜗的语音处理方法。该方法将输入的语音信号经过提升高频成分的预加重处理后,通过由m个带通滤波器组成的滤波器组,将语音信号分为m个频带,通过全波整流和低通滤波得到m个通道的包络信号并计算每个通道的调制深度,选择其中调制深度最大的n个通道,将n个通道的包络进行非线性函数压缩得到较窄的动态范围,将n个通道压缩后包络幅度信息用对称双相脉冲序列进行调制,调制脉冲序列在时序上不同步,脉冲交替出现,消除了通道间的干扰。在总刺激速率一定的条件下,用n个通道刺激电极得到每个通道的刺激速率大于用m个通道刺激电极时每个通道的刺激速率,较多的传递了语音信号的时域细节,提高语音识别的准确率。
申请公布号 CN101645267B 申请公布日期 2012.02.01
申请号 CN200910081610.8 申请日期 2009.04.03
申请人 中国科学院声学研究所 发明人 孟丽;肖灵;崔杰
分类号 G10L15/00(2006.01)I;G10L21/00(2006.01)I;G10L19/00(2006.01)I;A61F11/04(2006.01)I;A61F2/18(2006.01)I 主分类号 G10L15/00(2006.01)I
代理机构 北京法思腾知识产权代理有限公司 11318 代理人 杨小蓉
主权项 一种应用于电子耳蜗的语音处理方法,包括如下步骤:1)将通过麦克风采集的语音信号进行预加重处理,预加重处理通过高通滤波器实现,该高通滤波器采用硬件RC滤波器或者数字IIR、FIR滤波器;2)通过模数转换器ADC将预加重后的语音信号转换为数字信号,转换后的数字信号通过I2S格式或者SPI方式传输到主处理芯片;3)通过FFT方法或者滤波器组的方法将数字信号分为m个频段,即m个通道,每个通道对应一个频段,每个频段对应电极阵列中的一个电极;4)为得到刺激电极电流幅度,对每个通道进行包络提取,包络提取通过希尔伯特变换方法获得,或者通过对每个通道的语音信号进行全波整流和低通滤波实现;5)计算每个通道提取的包络信号的调制深度,即计算包络信号中最大值和最小值的比值,调制深度应用于检测输入信号中是否存在语音信号,以估计输入信号的信噪比,m个通道得到m个调制深度的值,将m个调制深度值进行由大到小的排序;6)选择m个通道中调制深度最大的n个通道,并输出该n个通道的包络信号,其中n<m;7)采用非线性函数对调制深度最大的n个通道的包络进行压缩,使n个通道的动态范围满足聋人较窄的电刺激动态范围;8)将n个通道压缩后的包络幅度值以曼彻斯特编码形式或者脉宽调制编码形式进行编码后,通过ASK调制发射。
地址 100190 北京市海淀区北四环西路21号中国科学院声学研究所