发明名称 一种基于发音模型的语音质量评测方法
摘要 本发明提供一种基于发音模型的语音质量评测方法,包括1.1)确定发音质量音素集;1.2)对训练数据划分发音质量等级;1.3)依据发音质量等级训练发音模型;2.1)提取待评测发音段的语音特征;2.2)构建基于所述发音模型的解码网络,进行Viterbi解码;2.3)对每个音素计算基于发音模型的置信度;2.4)根据所述置信度得出所述待评测发音段的发音质量。本发明不仅对不同的音素进行建模,还将发音质量的优劣加以区分。基于发音模型的语音质量评测方法中搭建的解码网络,可以充分利用发音质量的差异,从而获得更为准确的音素分割点,基于发音模型的置信度计算更接近理想的音素后验概率值,因此这种基于发音模型的语音质量评测方法具有更好的评估性能。
申请公布号 CN101840699A 申请公布日期 2010.09.22
申请号 CN201010164996.1 申请日期 2010.04.30
申请人 中国科学院声学研究所 发明人 葛凤培;颜永红
分类号 G10L11/00(2006.01)I;G10L15/00(2006.01)I;G10L15/06(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 北京法思腾知识产权代理有限公司 11318 代理人 杨小蓉;高宇
主权项 一种基于发音模型的语音质量评测方法,其特征在于:该方法包括发音模型的构建步骤和语音质量评测步骤;其中发音模型构建步骤包括下列子步骤:1.1)确定发音质量音素集;1.2)对训练数据划分发音质量等级;1.3)依据发音质量等级训练发音模型;语音质量评测步骤包括下列子步骤:2.1)提取待评测发音段的语音特征;2.2)构建基于所述发音模型的解码网络,进行Viterbi解码;2.3)对每个音素计算基于发音模型的置信度;2.4)根据所述置信度得出所述待评测发音段的发音质量。
地址 100190 北京市海淀区北四环西路21号