发明名称 韵律层级预测模型的生成及韵律层级预测方法和装置
摘要 本发明提出一种韵律层级预测模型的生成及韵律层级预测方法和装置,该韵律层级预测模型的生成方法包括:根据精标数据集生成初始的韵律层级预测模型;收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置;根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。该方法能够提高生成的韵律层级预测模型的准确性,进而提高韵律层级预测的准确性,提高语言合成效果。
申请公布号 CN105185373B 申请公布日期 2017.04.05
申请号 CN201510477652.9 申请日期 2015.08.06
申请人 百度在线网络技术(北京)有限公司 发明人 李秀林;张辉;杨鹏;徐扬凯;白锦峰;付晓寅
分类号 G10L13/10(2013.01)I 主分类号 G10L13/10(2013.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 宋合成
主权项 一种韵律层级预测模型的生成方法,其特征在于,包括:根据精标数据集生成初始的韵律层级预测模型;收集语音及对应的文本数据,检测语音中的特征信息,并将所述特征信息加入文本数据的对应位置,所述特征信息是停顿信息;根据所述初始的韵律层级预测模型,对加入特征信息的文本数据进行韵律层级预测,得到初始的韵律层级预测结果;根据所述精标数据集和所述初始的韵律层级预测结果进行训练,生成更新后的韵律层级预测模型,所述更新后的韵律层级预测模型用于语音合成时的韵律层级预测。
地址 100085 北京市海淀区上地十街10号百度大厦三层