发明名称 一种用于嵌入式语音合成系统的音库结构压缩及使用方法
摘要 本发明公开了一种用于嵌入式语音合成系统的音库结构压缩及使用方法,用于嵌入式系统,将接收到的任意文字转换成语音输出。以汉语中的音节作为合成系统及语音模型库的基本单元;首先创建基于音节的原始语音模型库,然后对所述原始语音模型库进行结构化的压缩,得到最终的压缩模型库。依据本发明提供的方法可以降低合成系统在嵌入式平台下所占用的空间资源,并提高合成速度,同时使合成语音保持良好的自然度和音质。
申请公布号 CN102201232A 申请公布日期 2011.09.28
申请号 CN201110145464.8 申请日期 2011.06.01
申请人 北京宇音天下科技有限公司 发明人 那兴宇;谢湘;何娅玲;何宇新
分类号 G10L13/02(2006.01)I;G10L13/08(2006.01)I;G10L15/14(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 代理人
主权项 一种用于嵌入式语音合成系统的参数化统计模型的结构化压缩和使用方法,用于减小模型库占用的空间并维持合成的音质。原始模型库的训练和合成过程采用汉语中的音节作为基本单元;模型库的压缩过程分为下述三个步骤:A.使用训练语音的增益、基频和声道谱系数特征参数创建基于汉语音节的初始模型库;B.根据初始模型中声道谱系数模型各个状态的上下文决策树叶节点的分布情况,进行码本分配和结构化压缩;C.对声道谱系数模型的方差进行二次压缩,并与其他模型合并得到最终的压缩模型库。
地址 100085 北京市海淀区上地南路10号院1号楼5单元401