发明名称 | 非话音语音的高性能低比特率编码方法和设备 | ||
摘要 | 一种用于非话音的语音片段的低比特率编码技术。一组增益在由一个线性预测滤波器白化语音信号以后从一个残余信号获得。然后这些增益被量化并被应用到一个随机产生的稀疏的激励上。该激励被滤波,其频谱特性被分析并且和初始的残余信号的频谱特性进行比较。在该分析的基础上选择一个滤波器以成形该激励的频谱特性而达到最佳的性能。 | ||
申请公布号 | CN1470051A | 申请公布日期 | 2004.01.21 |
申请号 | CN01817414.0 | 申请日期 | 2001.10.06 |
申请人 | 高通股份有限公司 | 发明人 | 黄鹏俊 |
分类号 | G10L19/14 | 主分类号 | G10L19/14 |
代理机构 | 上海专利商标事务所 | 代理人 | 张政权 |
主权项 | 1.一种编码非话音语音片段的方法,其特征在于,该方法包括:将一个残余信号帧划分成多个子帧;通过为多个子帧中的每一个子帧计算一个码本增益而建立一组子帧增益;将该子帧增益组分解成子帧增益子组;标准化子帧增益子组以产生多个标准化因子,其中多个标准化因子的每一个因子都和子帧增益的标准化子组之一相关联;将多个标准化因子的每一个因子都转换成指数形式并且将经转换的多个标准化因子量化;将标准化的子帧增益子组量化,以产生多个量化码本增益,其中码本增益的每一个增益都和多个子组之一的一个码本增益指数相关联;对多个子帧中的每一个子帧产生一个包括随机数的随机噪声信号;对多个子帧中的每一个子帧选择一预定百分比的随机噪声信号的最高振幅随机数;对每一个子帧由量化的码本增益按比例缩放经选择的最高振幅随机数以产生一个按比例缩放的随机噪声信号;带通滤波和成形该按比例缩放的随机噪声信号;分析残余信号帧的能量和按比例缩放的随机信号的能量以产生能量分析;在能量分析的的基础上选择第二滤波器并用该选择的滤波器进一步成形按比例缩放的随机噪声信号;以及产生一个第二滤波器选择指示以识别该选择的滤波器。 | ||
地址 | 美国加利福尼亚州 |