发明名称 改进噪声环境和频率失谐条件下话音识别性能的系统和方法
摘要 通过改善语音识别系统10的语音识别器,实现了一种可以改善语音识别性能的方法和系统。为了减少附加噪声效应提高语音识别系统的准确度,采用了吠声振幅的μ律压缩20。采用吠声振幅的A律压缩,来提高语音识别器的准确度。在语音识别器中,可以同时采用μ律压缩20和μ律扩展22,来提高语音识别器的准确度。在语音识别器中,可以同时采用A律压缩21和A律扩展,来提高语音识别器的准确度。
申请公布号 CN1473323A 申请公布日期 2004.02.04
申请号 CN01818337.9 申请日期 2001.10.25
申请人 高通股份有限公司 发明人 H·加鲁达德里
分类号 G10L15/20 主分类号 G10L15/20
代理机构 上海专利商标事务所 代理人 李家麟
主权项 1.一种分布式语音识别系统的语音识别器,其特征在于,它包括:配置用于将数字化语音信号转变为吠声(bark)振幅的吠声振幅生成模块;与吠声振幅生成模块相连接的μ-log压缩模块,所述μ-log压缩模块用以对吠声振幅执行μ-log压缩;与所述μ-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对μ-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的对数倒频谱转换模块,所述对数倒频谱转换模块用于生成J静态对数倒频谱系数以及J动态对数倒频谱系数。
地址 美国加利福尼亚州