发明名称 一种用于嵌入式语音合成系统的音库压缩及使用方法
摘要 本发明公开了一种用于嵌入式语音合成系统的音库压缩及使用方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。以汉语中的音节作为合成系统及语音模型库的基本单元;首先创建基于音节的原始语音模型库,然后对所述原始语音模型库进行数据分解和压缩,最后通过数据重组得到最终的压缩模型库。依据本发明提供的方法可以降低合成系统在嵌入式平台下所占用的空间资源,并提高合成速度,同时使合成语音保持良好的自然度和音质。
申请公布号 CN103077704A 申请公布日期 2013.05.01
申请号 CN201310041204.5 申请日期 2010.12.09
申请人 北京宇音天下科技有限公司;北京理工大学 发明人 那兴宇;谢湘;何娅玲;何宇新
分类号 G10L13/02(2013.01)I;G10L13/04(2013.01)I;G10L15/14(2006.01)I 主分类号 G10L13/02(2013.01)I
代理机构 北京君智知识产权代理事务所 11305 代理人 刘秀娟
主权项 一种嵌入式语音合成系统,包括以下模块:A.文本分析及韵律生成模块,用于对合成文本进行内容分析,得到对应的音节序列,同时每个音节附着相关的以上下文语境标识的韵律信息,其格式与模型训练时使用的标识相同;B.模型决策模块,用于接收上述附着韵律信息的音节序列,利用训练得到的模型决策树生成相应的模型状态序列,并得到时长决策结果;C.参数序列生成模块,用于接收上述模型状态序列,利用压缩频谱模型计算全局方差加窗矩阵,最后计算得到谱参数序列和基频参数序列;D.语音波形合成输出模块,用于接收参数序列,生成所要合成的语音波形数据,并输出播放或存储。
地址 100085 北京市海淀区上地南路10号院1号楼5单元401