发明名称 高表现力的语音合成方法和装置
摘要 本发明实施例公开了一种高表现力的语音合成方法和装置。所述高表现力的语音合成方法包括:将输入文本进行处理分析,得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文;根据所述状态的上下文,基于维特比算法从所述状态对应的包含至少两个高斯声学模型的高斯混合声学模型中选择一个高斯声学模型,作为合成语音的高斯声学模型;根据所选择的高斯声学模型生成声学参数,并根据生成的声学参数合成语音,包括利用声码器将声学参数来合成语音或者用声学参数指导声学片段的单元挑选来生成语音。本发明实施例提供的高表现力的语音合成方法和装置提高了合成语音的自然度。
申请公布号 CN104392716A 申请公布日期 2015.03.04
申请号 CN201410645715.2 申请日期 2014.11.12
申请人 百度在线网络技术(北京)有限公司 发明人 李秀林;贾磊;康永国
分类号 G10L13/027(2013.01)I;G10L13/08(2013.01)I 主分类号 G10L13/027(2013.01)I
代理机构 北京品源专利代理有限公司 11332 代理人 路凯;胡彬
主权项 一种高表现力的语音合成方法,其特征在于,包括:将输入文本进行处理分析,得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文;根据所述状态的上下文,基于维特比算法从所述状态对应的包含至少两个高斯声学模型的高斯混合声学模型中选择一个高斯声学模型,作为合成语音的高斯声学模型;根据所选择的高斯声学模型生成声学参数,并根据生成的声学参数合成语音。
地址 100085 北京市海淀区上地十街10号百度大厦三层