发明名称 文本到语音转换设备及其转换方法
摘要 本发明涉及文本到语音转换设备及其转换方法。根据本发明实施例的一个方面,提供一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述停顿被插入到将被转换为声音信号的文本数据中的一连串音素之间;音素长度调整器,通过分别根据声音信号的速度确定音素的长度,以及选择性调整文本数据中作为摩擦音的至少一个音素的长度,使得至少一个摩擦音音素与其它音素相比在时间上被相对延长,以此调整音素数据和停顿数据;以及输出单元,用于基于通过音素长度调整器所调整的音素数据和停顿数据,输出声音信号。本发明能够改善文本转换为语音的可识别性和可听性。
申请公布号 CN101334995A 申请公布日期 2008.12.31
申请号 CN200810124895.4 申请日期 2008.06.25
申请人 富士通株式会社 发明人 西池理香;佐佐木均
分类号 G10L13/02(2006.01);G10L13/08(2006.01) 主分类号 G10L13/02(2006.01)
代理机构 隆天国际知识产权代理有限公司 代理人 张龙哺
主权项 1.一种将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述多个停顿被插入到将被转换为声音信号的所述文本数据中的一连串音素之间;音素长度调整器,通过分别根据所述声音信号的速度确定所述音素的长度,以及通过在所述文本数据中作为摩擦音的所述音素中选择性调整至少一个摩擦音音素的长度,使得所述至少一个摩擦音音素与其它音素相比在时间上被相对延长来调整所述音素数据和所述停顿数据;以及输出单元,基于由所述音素长度调整器所调整的音素数据和停顿数据,来输出声音信号。
地址 日本神奈川县川崎市