发明名称 汉语语音码语音合成方法
摘要 本发明是一种汉语语音码转换成语音的方法,属于计算机语音合成技术领域。通过这种方法可以方便地将包含汉语声、韵、调用且仅用26个拉丁字母作码元的汉语语音码转换成汉语、汉语特定人、方言、少数民族语言、外语单词词组及其短语的语音,采用这种汉语语音码后,就克服了目前所有汉语语音合成只能用汉字或汉语拼音进行,且汉字和汉语拼音与ASCII码不能100%兼容的弊端,本发明能广泛应用于语音合成技术领域,给计算机语音信息处理提供了极大的便利。
申请公布号 CN101123089B 申请公布日期 2011.01.26
申请号 CN200610029807.3 申请日期 2006.08.08
申请人 苗玉水 发明人 苗玉水
分类号 G10L13/02(2006.01)I;G10L13/00(2006.01)I;G06F17/28(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 代理人
主权项 一种计算机汉语语音码语音合成方法,其特征主要包括以下步骤:步骤A:(一)所采用的汉语语音码的每一音节声、韵、调的编码方法采用以下的方法:注:括号内的符号均为汉语拼音符号,不带括号的字母为所采用的汉语每一音节声、韵、调的编码,以下将下列对照表简称为汉语语音码与汉语拼音声母、介母、韵母、声调编码对照表或汉语音节语音码的声码、介码、韵码、调码与汉语拼音编码对照表1、声码的编码:b:(b) p:(p) m:(m) f:(f) d:(d)       t:(t)n:(n) l:(l) g:(g) k:(k) h:(h)j:(zh),(j)  q:(ch),(q)  x:(sh),(x) r:(r)z:(z) c:(c) s:(s) y:(y) w:(w)2、介码的编码:i:(i) u:(u) y:(ü)3、韵码的编码:a:(a)   o:(o)  e:(e)   i:(i)   u:(u)  y:(ü)k:(ao)  c:(ai) s:(an)  x:(ou)  w:(ei) n:(en)z:(ua)  l:(uo) b:(ang) d:(ong) p:(eng)q:(ing) g:(ng) er为无声母韵母er:(er)r:(i)[只与(zh)、(ch)、(sh)相拼]4、调码的编码:a :(‑)阴平 e:(/)阳平 v:(∨)上声 u:(/)去声o:(不标)轻声(二)利用上述编码的汉语语音码表示可以采用如下的方法:以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码,同一个单词的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开,当汉语信息表示处于汉语语音码状态时,其六种点号,七种标号和一个移行号采用与英文相同的形式;步骤B:当汉语语音码转换成汉语语音时,采用查汉语语音码中的音节和汉语音节语音合成文件对照表输出相应的汉语语音;当语音码转换成汉语语音时,除了采用以音节为单位进行语音转换外,还可以采用查以词为单位的汉语语音码和汉语单词语音合成文件对照表输出相应的汉语语音;当语音码转换成汉语语音时,除了采用以音节或以词为单位进行语音转换外,还可以通过最大匹配法,采用查以最大语段为单位的汉语语音码串和汉语语段语音合成文件对照表输出相应的汉语语音;当将汉语语音码或汉语语音码串所分别对应的音节、单词或语段的语音合成文件分别换成汉语特定人、中国方言、少数民族语言的语音合成文件时,通过查汉语语音码或汉语语音码串与相应音节、单词或语段的语音合成文件对照表,可以分别输出相应的汉语特定人、中国方言、少数民族语言的语音;当合成外语语音时,要进行查以词、词组或短语为单位的汉语语音码和相应外语单词、外语词组或外语短语语音合成文件对照表输出相应的外语单词、外语词组或外语短语的语音;对需要输入汉语每一个音节的声母、介母、韵母和声调信息才能进行汉语语音合成的系统,可以根据步骤A中的汉语语音码与汉语拼音声母、介母、韵母、声调编码对照表,将汉语语音码转换成汉语拼音声母、介母、韵母和声调的信息后,再输入到汉语语音合成系统中进行汉语语音合成;当对汉语语音码文章中的标点符号和移行号进行语音合成时,我们只要将相应的预先储存在计算机中的标点符号和移行号的声音文件提取出来,用声音播放软件进行播放便可,比如:六种点号:句号“.”(jùhào.wav)、问号“ ”(wènhào.wav)、感叹号“!”(gǎntànhào.wav)、逗号“,”(dòuhào.wav)、冒号“:”(màohào.wav)、分号“;”(fēnhào.wav);七种标号:引号“”(yǐnhào.wav)、括号()(kuòhào.wav)、破折号“‑”(pòzhéhào.wav)、省略号...(shěngluèhào.wav)、着重号.(zhuózhònghào.wav)、书名号(())(shūmínghào.wav)、间隔号.(jiàngéhào.wav);一个移行号:移行号“‑”(yíhánghào.wav);括号中的“.wav”文件就是与标点符号或移行号发音相应的语音合成文件,当该语音合成文件是汉语的语音合成文件时,则该标点符号或移行号朗读出来的声音便是汉语相应的标点符号或移行号的声音,当该语音合成文件分别是汉语特定人、中国方言、少数民族语言的语音合成文件时,则该标点符号或移行号朗读出来的声音便分别是汉语特定人、中国方言、少数民族语言的相应的标点符号或移行号的声音。
地址 200093 上海市杨浦区控江一村44号甲105室