发明名称 |
一种基于发音模型的语音质量评测方法 |
摘要 |
本发明提供一种基于发音模型的语音质量评测方法,包括1.1)确定发音质量音素集;1.2)对训练数据划分发音质量等级;1.3)依据发音质量等级训练发音模型;2.1)提取待评测发音段的语音特征;2.2)构建基于所述发音模型的解码网络,进行Viterbi解码;2.3)对每个音素计算基于发音模型的置信度;2.4)根据所述置信度得出所述待评测发音段的发音质量。本发明不仅对不同的音素进行建模,还将发音质量的优劣加以区分。基于发音模型的语音质量评测方法中搭建的解码网络,可以充分利用发音质量的差异,从而获得更为准确的音素分割点,基于发音模型的置信度计算更接近理想的音素后验概率值,因此这种基于发音模型的语音质量评测方法具有更好的评估性能。 |
申请公布号 |
CN101840699A |
申请公布日期 |
2010.09.22 |
申请号 |
CN201010164996.1 |
申请日期 |
2010.04.30 |
申请人 |
中国科学院声学研究所 |
发明人 |
葛凤培;颜永红 |
分类号 |
G10L11/00(2006.01)I;G10L15/00(2006.01)I;G10L15/06(2006.01)I |
主分类号 |
G10L11/00(2006.01)I |
代理机构 |
北京法思腾知识产权代理有限公司 11318 |
代理人 |
杨小蓉;高宇 |
主权项 |
一种基于发音模型的语音质量评测方法,其特征在于:该方法包括发音模型的构建步骤和语音质量评测步骤;其中发音模型构建步骤包括下列子步骤:1.1)确定发音质量音素集;1.2)对训练数据划分发音质量等级;1.3)依据发音质量等级训练发音模型;语音质量评测步骤包括下列子步骤:2.1)提取待评测发音段的语音特征;2.2)构建基于所述发音模型的解码网络,进行Viterbi解码;2.3)对每个音素计算基于发音模型的置信度;2.4)根据所述置信度得出所述待评测发音段的发音质量。 |
地址 |
100190 北京市海淀区北四环西路21号 |