发明名称 一种用于嵌入式语音合成系统的音库压缩及使用方法
摘要 本发明公开了一种用于嵌入式语音合成系统的音库压缩及使用方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。以汉语中的音节作为合成系统及语音模型库的基本单元;首先创建基于音节的原始语音模型库,然后对所述原始语音模型库进行数据分解和压缩,最后通过数据重组得到最终的压缩模型库。依据本发明提供的方法可以降低合成系统在嵌入式平台下所占用的空间资源,并提高合成速度,同时使合成语音保持良好的自然度和音质。
申请公布号 CN102063897B 申请公布日期 2013.07.03
申请号 CN201010580790.7 申请日期 2010.12.09
申请人 北京宇音天下科技有限公司;北京理工大学 发明人 那兴宇;谢湘;何娅玲;何宇新
分类号 G10L13/04(2013.01)I;G10L13/08(2013.01)I;G10L19/032(2013.01)I;G10L19/107(2013.01)I 主分类号 G10L13/04(2013.01)I
代理机构 北京君智知识产权代理事务所 11305 代理人 刘秀娟
主权项 一种用于嵌入式语音合成系统的参数化统计模型的压缩方法,用于减小模型库占用的空间并维持合成的音质;原始模型库的训练和合成过程采用汉语中的音节作为基本单元;所述方法步骤如下: A.创建基于汉语音节的原始模型库; B.将原始频谱模型分解为能量、谱均值和谱方差三部分;利用矢量量化技术对谱均值和谱方差分别进行压缩; 步骤B分为: B1.将频谱模型的状态高斯分布分为能量、谱均值和谱方差三部分; B2.将所有状态分布的均值矢量作为训练样本,进行矢量量化的码本训练;所述所有状态分布的均值矢量包含静态特征、一阶动态特征和二阶动态特征; B3.搜索矢量量化分类后每一类中离码本距离最小的训练样本,替代该类码本保存下来; B4.用新的码本对训练样本重新分类; B5.判断新的分类结果与原分类结果是否相同,如果是,则谱均值矢量量化码本训练结束;如果否,则返回步骤B3,重复步骤B3、B4; B6.将所有状态分布的方差矢量进行平均,得到全局方差矢量;所述所有状态分布的方差矢量包含静态特征、一阶动态特征和二阶动态特征; C.将能量、压缩得到的谱均值码本和索引以及全局方差组合得到压缩频谱模型,并与其他模型合并得到最终的压缩模型库,所述其他模型包括时长和基音频率模型。
地址 100085 北京市海淀区信息路15号915室