发明名称 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法
摘要 本发明涉及一种用于合成语音的方法、设备以及用于训练在语音合成中使用的声学模型的方法。所述用于合成语音的方法可以包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。根据本发明的实施例的方法和设备,可以对中文中难以预测的多音字进行模糊化处理,从而改善中文多音字合成的质量。
申请公布号 CN102651217A 申请公布日期 2012.08.29
申请号 CN201110046580.4 申请日期 2011.02.25
申请人 株式会社东芝 发明人 汪曦;楼晓雁;李健
分类号 G10L13/02(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 北京市中咨律师事务所 11247 代理人 杨晓光;于静
主权项 一种用于语音合成的方法,包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。
地址 日本东京都