发明名称 一种基于决策树的语音时长预测装置及方法
摘要 本发明为一种基于决策树的语音时长预测装置及方法。包括:输入部,用于输入语言、语音学标注序列;决策树生成部,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下文、语音单位的韵律边界等级、语音单位的重音等级中的至少一个为基准设定改变语音单位固定时长的变更量;以所述的固定时长和所述固定时长的变更量为基准对输入的语言、语音学标注序列的各个相应的语音单位进行改变;输出部,用于输出语音单位时长预测结果序列。从而能够在语音合成时对语音单位时长进行预测。
申请公布号 CN1956057A 申请公布日期 2007.05.02
申请号 CN200510117003.4 申请日期 2005.10.28
申请人 富士通株式会社 发明人 郭庆;片江伸之
分类号 G10L13/08(2006.01);G10L13/00(2006.01) 主分类号 G10L13/08(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 任默闻
主权项 1.一种基于决策树的语音单位时长预测装置,包括:输入部,用于输入语言、语音学标注序列;其特征在于还包括:决策树生成部,通过对音库进行语言、语音学的标注,形成语音单位的标注样本,从所述的标注样本中学习语音单位的变化规律,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下文、语音单位的韵律边界等级、语音单位的重音等级中的至少一个为基准设定改变语音单位固定时长的变更量;以所述的固定时长和所述固定时长的变更量为基准对输入的语言、语音学标注序列的各个相应的语音单位进行改变;输出部,用于输出语音单位时长预测结果序列。
地址 日本神奈川县