发明名称 基于韵律结构的语音合成文本处理方法
摘要 本发明提供了一种能够丰富和改进韵律控制方法、进一步提高汉语语音合成自然度的基于韵律结构的语音合成文本处理方法。它包括以下计算机可实现的步骤:文本规整步骤,用于将输入的文本与预先设置的特殊符号表相比较,输出合法读音字符串;韵律结构分析步骤,用于将合法读音字符串根据预先设置的分词规则、韵律结构分析规则进行比较,并输出标注了韵律结构信息的标注字符串;语言学处理步骤,用于将标注字符串逐字与预先设置的韵律规则、拼音表进行比较,并输出标注了韵律信息的标注拼音码串。本发明从汉语的语音特征、汉语的声调与特点和汉语的语调及模式出发,构筑一套完整的基于韵律结构的语音合成文本处理方法。
申请公布号 CN101000764B 申请公布日期 2011.05.18
申请号 CN200610151151.2 申请日期 2006.12.18
申请人 黑龙江大学 发明人 张鹏;王丽红
分类号 G10L13/00(2006.01)I;G10L13/08(2006.01)I;G10L13/02(2006.01)I 主分类号 G10L13/00(2006.01)I
代理机构 哈尔滨市哈科专利事务所有限责任公司 23101 代理人 祖玉清
主权项 一种基于韵律结构的语音合成文本处理方法,其特征在于它包括以下计算机可实现的步骤:(1)文本规整步骤,将输入的文本句子字符串按照预先设置的特殊符号表转换成合法读音字符串,输出合法读音字符串给韵律结构分析步骤;(2)韵律结构分析步骤,将接收到的合法读音字符串送入韵律结构分析模块进行处理,根据预先设置的分词规则、韵律结构生成规则对合法读音字符串标注韵律结构信息,输出标注了韵律结构信息的标注字符串给语言学处理步骤;其中,所述的韵律结构分析模块包括以下几个子模块:分词和词性标注子模块,用以对输入的合法读音字符串根据预先设置的分词规则进行比较,将字符串根据分词规则标注分词信息和词性信息,输出标注了分词信息和词性信息的字符串送给韵律结构预测子模块;所述的预先设置的分词规则为:将输入文本的合法读音字符串从句首向句尾、逐字假设分割点形成词,从当前字向后进行最大词匹配处理确定词边界;韵律结构预测子模块,用以将送入的标注分词信息和词性信息的字符串构建韵律结构预测树,并根据韵律结构预测树来确定韵律边界位置,对目标语句确定输出语句的韵律组块及其层级结构,输出标注韵律层次结构的标注字符串给语言学处理步骤;其中,所述的韵律结构生成规则进一步包括以下几个处理步骤:将语句中在句法上距离最近的语法词两两连接为韵律节点,构成韵律词;再将在句法上距离最近的韵律词两两连接为更高一个层级的韵律节点,构成韵律短语;重复连接构建,直到在句法上仅有一个最高层级的节点,构成语调短语;将同层的每两个相邻的节点之间划分为韵律边界或一个韵律停顿,则构建成为韵律结构预测树;其中韵律结构的特点是:一个语调短语包括一个或一个以上的韵律短语,一个韵律短语包括一个或一个以上的韵律词,一个韵律词包括一个或一个以上的语法词;两个语法词在同一个韵律词内部;两个语法词在不同的韵律词内,但在同一个韵律短语内;两个语法词不在同一个韵律短语内;(3)语言学处理步骤,将接收到的标注字符串送入语言学处理模块进行处理,逐字按照预先设置的韵律生成规则、拼音表进行字音转换,将韵律结构信息标注映射为相应韵律信息,将输入的汉字符映射为拼音码,输出处理后的标注拼音码串给语音合成处理程序;其中,所述的语言学处理模块进一步包括以下几个子模块:音变、变调分析子模块,用以将送入的标注字符串进行音变现象分析,将两字词、三字词和四字词与预先设置的韵律规则库中的音变、变调规则相比较,将应发生音变或变调现象的字或音节标注为正确的音调,输出的字符串给停顿分析子模块;所述的音变、变调分析子模块处理过程为:将每个词组的字符串按照二字词、三字词和四字词分别与文本处理数据库中的音变、变调规则表进行匹配比对,如果完全匹配则进行相应的转换处理,输出转换后的字符串,否则输出原字符串;停顿分析子模块,用以将音变、变调分析子模块送入的标注字符串与预先设置的韵律规则库中的停顿规则相比较,对标注字符串按照韵律边界的不同插入适当时问长度的停顿或无声段,输出的字符串给强调、重音分析子模块;所述的停顿分析子模块的处理过程为:将标注的字符串根据韵律规则中的停顿规则,按照韵律边界的不同,从句首向句尾、依次将字符串中韵律边界标记与韵律词标记、韵律短语标记和语调短语标记进行匹配,如果满足其一就在其韵律边界标记处插入与韵律边界标记等价的停顿,否则字符串保持不变;强调、重音分析子模块,用以将停顿分析子模块送入的标注字符串根据常规重音分布规律标注重音位置,并按照韵律结构预测树韵律边界的不同标注重音位置,以及预先设置的韵律规则中的强调、重音规则修正停顿的时间长度或者韵律边界的字词的音高或时长,输出的字符串给字音转换子模块;所述的强调、重音分析子模块中标注重音位置步骤又包括以下计算机可以实现的步骤:将得到的字符串按照韵律结构预测树内部两个分叉之间的句法关系,以及常规重音分布规律,给每个二分叉韵律成分标注相对的轻、重地位;计算每个韵律词最后标注的重度指标,确定每个韵律词的重度;将各个韵律词的重度标注于字符串上,输出标注后的字符串;字音转换子模块,用以将强调、重音分析子模块送入的字符串按照拼音表转换成标注韵律信息的拼音码串并输出,输出的字符串给语音合成处理程序;所述的字音转换子模块的处理过程为:将文本字符从句首向句尾、依次将字符与文本处理数据库中的拼音表进行匹配,如果满足匹配要求则就将该字符用与其对应的拼音码替代,直至将整个文本字符替代完毕,输出标准音码串。
地址 150080 黑龙江省哈尔滨市南岗区学府路74号