发明名称 基于抖动失真的语音频客观质量评价方法及系统
摘要 本发明公开了一种基于抖动失真的语音频客观质量评价方法及系统,包括感知模型和认知模块,感知模型进一步包括时频分析模块、音色感知模块、质量抖动模块和能量均衡模块,感知模型的输出为模型输出参数,经由认知模型拟合得到用户体验得分。本发明提出了一种考虑了质量抖动影响的语音频的客观质量评价方法及系统,适用于中低码率语音频的移动语音频,且评价结果更接近真实主观听觉感受。
申请公布号 CN103050128B 申请公布日期 2014.11.05
申请号 CN201310033963.7 申请日期 2013.01.29
申请人 武汉大学 发明人 胡瑞敏;杨玉红;余洪江;谢松波;董少龙;张聪;高丽;李登实;涂卫平;王晓晨
分类号 G10L25/60(2013.01)I 主分类号 G10L25/60(2013.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 一种基于抖动失真的语音频客观质量评价方法,包括融合语音频失真特征得到测试信号的语音频客观质量评价分数的步骤,其特征是:所述的语音频失真特征包括抖动失真参数,所述的抖动失真参数采用如下方法获得:根据原始信号和测试信号的频域信号得到测试信号总体失真,并获取总体失真超过设定阈值的测试信号,基于总体失真超过设定阈值的测试信号获取测试信号的抖动失真参数;所述的测试信号总体失真<img file="FDA0000566109270000011.GIF" wi="399" he="138" />其中,N<sub>(k,l)</sub>为连续丢包数为l时、测试信号的第k帧信号的总体失真;σ<sup>2</sup>[k+i]为第(k+i)帧原始信号和测试信号的频域窗信号的均方差;所述的测试信号的抖动失真参数<img file="FDA0000566109270000012.GIF" wi="569" he="134" />其中,w<sub>k,l</sub>是权重,<img file="FDA0000566109270000013.GIF" wi="199" he="121" />l<sub>max</sub>为最大连续丢包数;P<sub>k,l</sub>是第k帧信号连续丢包数为l的概率;(K,L)表示总体失真超过设定阈值的测试信号区域。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学