发明名称 生成高质量话音的系统和方法
摘要 提供一种系统包括:  音素段存储部分,存储多个音素段数据块;合成部分,通过从音素段存储部分读取与代表输入文本的发音的各个音素对应的音素段数据块、然后将音素段数据块彼此相连,来生成代表文本的合成话音的语音数据;计算部分,根据语音数据来计算指示代表文本的合成话音的语音数据的不自然度的得分;意译存储部分,存储作为多个第一注释的意译的多个第二注释,并将第二注释与各个第一注释关联;替换部分,搜索文本以找到与任何第一注释相匹配的注释,并用与第一注释对应的第二注释来替换搜索到的注释;以及判断部分,在计算出的得分小于参考值的情况下,输出所生成的语音数据,并将替换后文本输入到合成部分中,以使合成部分进一步生成用于该文本的语音数据。
申请公布号 CN101236743B 申请公布日期 2011.07.06
申请号 CN200810003761.7 申请日期 2008.01.22
申请人 纽昂斯通讯公司 发明人 立花隆辉;长野彻;西村雅史
分类号 G10L13/02(2006.01)I;G10L13/04(2006.01)I;G06F17/00(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 黄小临
主权项 一种用于生成合成话音的系统,该系统包括:音素段存储部分,用于存储指示彼此不同的音素的声音的多个音素段数据块;合成部分,用于通过接收输入文本、读取与指示所述输入文本的发音的各个音素对应的音素段数据块、然后将读出的音素段数据块彼此相连,来生成代表所述文本的合成话音的语音数据;计算部分,用于根据所述语音数据来计算指示所述文本的合成话音的不自然度的得分;意译存储部分,用于存储作为多个第一注释的意译的多个第二注释,并将所述第二注释与各个所述第一注释关联;替换部分,用于搜索所述文本以找到与任何所述第一注释相匹配的注释,并用与所述第一注释对应的所述第二注释来替换搜索到的注释;以及判断部分,用于在计算出的得分小于预定的参考值的情况下,输出所生成的语音数据,并在所述得分等于或大于所述参考值的情况下,指令所述替换部分将替换后的所述文本输入到所述合成部分中,以便使所述合成部分进一步生成用于替换后文本的语音数据。
地址 美国马萨诸塞州