发明名称 |
语音合成数据库停顿信息自动标注方法及系统 |
摘要 |
本发明涉及一种语音合成数据库停顿信息自动标注系统及方法,该方法包括:获取语音合成数据库中待标注的语音数据;将所述语音数据转化为语音特征帧序列并判断所述语音特征帧序列中的停顿信息,形成停顿信息的预测位置;将所述语音数据转化为文本数据;利用自动切分对齐方法计算所述语音数据和所述文本数据在时间轴上的映射关系;基于所述映射关系将所述停顿信息插入到所述文本数据中以形成标注文本信息;以及利用自动切分对齐方法计算所述语音数据和所述标注文本信息在时间轴上的映射关系。本发明实现了自动标注数据中语音数据的停顿信息,节省了靠人工听来标注停顿的成本和时间,周期短,准确率高,还具有良好的经济效益。 |
申请公布号 |
CN105632484A |
申请公布日期 |
2016.06.01 |
申请号 |
CN201610091554.6 |
申请日期 |
2016.02.19 |
申请人 |
上海语知义信息技术有限公司 |
发明人 |
刘青松;许东星;王鸣;黄盼 |
分类号 |
G10L13/08(2013.01)I |
主分类号 |
G10L13/08(2013.01)I |
代理机构 |
上海唯源专利代理有限公司 31229 |
代理人 |
曾耀先 |
主权项 |
一种语音合成数据库停顿信息自动标注方法,其特征在于,包括:获取语音合成数据库中待标注的语音数据;将所述语音数据转化为语音特征帧序列并判断所述语音特征帧序列中的停顿信息,形成停顿信息的预测位置;从语音合成数据库中获取与所述语音数据对应的文本数据;利用自动切分对齐方法计算所述语音数据和所述文本数据在时间轴上的映射关系;基于所述映射关系将所述停顿信息插入到所述文本数据中以形成标注文本信息;以及利用自动切分对齐方法计算所述语音数据和所述标注文本信息在时间轴上的映射关系。 |
地址 |
200031 上海市徐汇区钦州北路1198号82幢2层01室 |