发明名称 基于HMM的双语(普通话-英语)TTS技术
摘要 一种用于基于一种或多种语言的文本来生成语音的示例性方法,该方法包括提供两种或更多语言的音素集、训练包括跨语言状态级共享的多语言HMM、接收该多语言HMM的语言中的一种或多种语言的文本、以及至少部分地基于该多语言HMM来生成对应于所接收到的文本的语音。其他示例性技术包括第一语言的决策树和第二语言的决策树之间的映射和可任选地反方向的映射、以及对多语言文本-语音系统的Kullback-Leibler散度分析。
申请公布号 CN101785048B 申请公布日期 2012.10.10
申请号 CN200880103469.0 申请日期 2008.08.19
申请人 微软公司 发明人 Y·钱;F·K-P·宋
分类号 G10L13/00(2006.01)I 主分类号 G10L13/00(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 蔡悦;钱静芳
主权项 一种至少部分地由计算机实现的用于基于一种或多种语言的文本来生成语音的方法,所述方法包括:提供两种或多种语言的音素集,其中分析所述两种或多种语言的子音素和/或复杂音素以用于在所述两种或多种语言之间共享;基于来自所述两种或多种语言的训练数据训练多语言隐马尔科夫模型HMM,所述训练数据不包括混合语言句子,其中所述HMM包括跨所述两种或多种语言状态级共享;将所述多语言HMM的状态聚类成决策树,其中该聚类使用语言无关问题和/或语言专用问题;接收所述多语言HMM的一种或多种语言的文本;以及至少部分地基于所述多语言HMM来生成对应于所接收到的文本的语音。
地址 美国华盛顿州