发明名称 以感知参数为基础的客观语音质量估测方法
摘要 本发明公开了一种以感知参数为基础的客观语音质量估测方法,利用一个同时考虑时间和频率上变化的人耳听觉模型来对语音质量做客观的评量。这个以生理物理及神经生理现象建立的听觉模型,可成功描述人类两个听觉感知阶段对语音信号分别所做的估计及分析。本发明由这两个阶段,撷取出在感知上可能影响听者判断语音质量好坏的三个特征参数,来对语音质量做客观评量。这三个特征参数分别是可理解度、清晰度和自然度。本发明进而使用复回归分析,将三个特征参数对语音质量影响的关系做结合,由此估计出主观的语音质量分数,通过这三个基本的特征参数,对语音质量的好坏做快速并可靠的评量。
申请公布号 CN101727896A 申请公布日期 2010.06.09
申请号 CN200910261011.4 申请日期 2009.12.08
申请人 中华电信股份有限公司 发明人 冀泰石;黄冠郎;颜廷宇;陈建宏;杨仲捷
分类号 G10L11/00(2006.01)I;G10L19/00(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 广州华进联合专利商标代理有限公司 44224 代理人 万志香;曾旻辉
主权项 一种以感知参数为基础的客观语音质量估测方法,其特征在于:其步骤包括:步骤一:将输入语音通过人耳听觉模型处理,得到在时间轴及对数频率轴上分布的二维听觉频谱图;步骤二:将上述的二维听觉频谱图经过具有不同方向性,不同对数频率上的变化率及不同时间上的变化率的二维时频域脉冲响应的滤波器组后,其输出得到具有维度分别为时间、对数频率、在时间轴上波封的变化率及在对数频率轴上波封的变化率的四维特征矩阵,接着在时间和对数频率轴上取平均,得到rate-scale二维图像;步骤三:取得长时间干净语音,并依照上述相同步骤计算得到干净语音的rate-scale二维图像;步骤四:将干净语音及输入语音的rate-scale二维图像相减当做失真矩阵,并将此失真矩阵分割成数个区域,这些区域可以均匀或不均匀分割,然后为每个区域计算失真和,用来当做失真的特征参数,如此得到一个失真的特征参数向量;步骤五:将此失真的特征参数向量经过一个转换方式而得到一个估算的主观语音质量分数。
地址 中国台湾桃园县杨梅镇新荣里民族路五段551巷12号