发明名称 |
用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
摘要 |
本发明涉及一种用于合成语音的方法、设备以及用于训练在语音合成中使用的声学模型的方法。所述用于合成语音的方法可以包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。根据本发明的实施例的方法和设备,可以对中文中难以预测的多音字进行模糊化处理,从而改善中文多音字合成的质量。 |
申请公布号 |
CN102651217A |
申请公布日期 |
2012.08.29 |
申请号 |
CN201110046580.4 |
申请日期 |
2011.02.25 |
申请人 |
株式会社东芝 |
发明人 |
汪曦;楼晓雁;李健 |
分类号 |
G10L13/02(2006.01)I |
主分类号 |
G10L13/02(2006.01)I |
代理机构 |
北京市中咨律师事务所 11247 |
代理人 |
杨晓光;于静 |
主权项 |
一种用于语音合成的方法,包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。 |
地址 |
日本东京都 |