发明名称 语音合成方法及系统
摘要 本发明公开了一种语音合成方法及系统,该方法包括:接收待合成文本;对所述待合成文本进行预处理,得到所述待合成文本的待合成单元序列及待合成单元的上下文相关信息;根据所述待合成单元的上下文相关信息从音库中获取所述待合成单元序列的最优备选语音数据;获取测听人员对所述备选语音数据的测听结果;根据所述测听结果对所述音库进行扩充;利用扩充后的音库重新获取所述待合成单元序列的最优备选语音数据,并将重新获取的最优备选语音数据作为优化后的语音数据;将所述优化后的语音数据作为所述待合成文本的合成语音数据输出。利用本发明,可以准确地将人工主观听感融合到待合成文本的合成结果中,提升语音合成效果。
申请公布号 CN106297766A 申请公布日期 2017.01.04
申请号 CN201510305764.6 申请日期 2015.06.04
申请人 科大讯飞股份有限公司 发明人 夏咸军;江源;王影;胡国平;胡郁;刘庆峰
分类号 G10L13/10(2013.01)I;G10L13/08(2013.01)I;G10L25/69(2013.01)I;G10L25/03(2013.01)I 主分类号 G10L13/10(2013.01)I
代理机构 北京维澳专利代理有限公司 11252 代理人 刘路尧;逢京喜
主权项 一种语音合成方法,其特征在于,包括以下步骤:(1)接收待合成文本;(2)对所述待合成文本进行预处理,得到所述待合成文本的待合成单元序列及待合成单元的上下文相关信息;(3)根据所述待合成单元的上下文相关信息从音库中获取所述待合成单元序列的最优备选语音数据;(4)获取测听人员对所述最优备选语音数据的测听结果;(5)根据所述测听结果对所述音库进行扩充;(6)利用扩充后的音库重新获取所述待合成单元序列的最优备选语音数据,并将重新获取的最优备选语音数据作为优化后的语音数据;(7)将所述优化后的语音数据作为所述待合成文本的合成语音数据输出。
地址 230088 安徽省合肥市高新开发区望江西路666号