发明名称 语音合成装置以及其方法
摘要 一种语音合成装置(10)包含:用以将每个各包含至少一个因素的语音区段分解成复数个音调波形的语音区段分解构件(101)、用以将音调波形的相位特性转换成一致之相位特性的相位特性转换构件(103)、用以将音调波形分类成复数群的音调波形分类构件(104)、用以藉由从每群的音调波形中撷取一个音调波形来将音调波形注册于资料库(111)中的音调波形注册构件(106),及利用注册于资料库(111)中的音调波形来合成语音的合成构件107。所架构的语音合成装置(10)能够利用相当小的资料库容量来对自然语音进行合成。
申请公布号 TW525145 申请公布日期 2003.03.21
申请号 TW090122653 申请日期 2001.09.12
申请人 松下电器产业股份有限公司 发明人 望月亮;礒野敏幸;西村洋文
分类号 G10L13/06 主分类号 G10L13/06
代理机构 代理人 林志刚 台北市中山区南京东路二段一二五号七楼
主权项 1.一种用以对语音进行合成的语音合成装置,该语音由包含多数个语音区段,每个语音区段包括至少一个音素,包含:用以储存与语音区段相关之资料的资料库;用以将每个语音区段分解成复数个各具有其相位特性之音调波形的语音区段分解构件;用以将该音调波形的相位特性转换成对每个音调波形一致之相位特性的相位特性转换构件;用以将音调波形分类成复数群的音调波形分类构件,其每群皆由复数个形状相同的音调波形所组成;用以藉由从每群的音调波形中撷取一个音调波形来将音调波形注册于资料库中的音调波形注册构件;及利用注册于资料库中的音调波形来合成语音的合成构件。2.根据申请专利范围第1项所述的语音合成装置,其进一步包含相位特性产生构件,其用以根据藉由分解语音区段所得之音调波形的相位特性来产生一致的相位特性。3.根据申请专利范围第2项所述的语音合成装置,其中该相位特性产生构件是藉由将分解语音区段所得之音调波形的相位特性进行平均来产生一致的相位特性。4.根据申请专利范围第1项所述的语音合成装置,其中该音调波形分类构件是根据各自的音素类型来将音调波形进行分类。5.根据申请专利范围第1项所述的语音合成装置,其中该音调波形分类构件是藉由在各个仅用于比较的频率上对加权振幅特性的音调波形进行比较来将音调波形进行分类。6.根据申请专利范围第1项所述的语音合成装置,其进一步包含音调波形选择构件,当组合语音时,其用以藉由将相邻的音调波形进行比较来选择将注册于资料库中的音调波形。7.一种对语音进行合成的语音合成方法,该语音由包含多数个语音区段,每个语音区段包括,包含以下的步骤:将每个语音区段分解成复数个各具其相位特性之音调波形的话音区段分解步骤;将音调波形的相位特性转换成对每个音调波形一致之相位特性的相位特性转换步骤;将音调波形分类成复数群的音调波形分类步骤,其每一群是由复数个形状相同的音调波形所组成;用以藉由从每群的音调波形中撷取一个音调波形来将音调波形注册于资料库中的音调波形注册步骤;及利用注册于资料库中的音调波形来合成语音的合成步骤。8.根据申请专利范围第7项所述的语音合成方法,其进一步包含相位特性产生步骤,其用以根据藉由分解语音区段所得之音调波形的相位特性来产生一致的相位特性。9.根据申请专利范围第8项所述的语音合成方法,其中该相位特性产生步骤藉是由将分解语音区段所得之音调波形的相位特性进行平均来产生一致的相位特性。10.根据申请专利范围第7项所述的语音合成方法,其进一步包含音调波形预先分类步骤,其用以预先根据各自的音素类型来将音调波形进行分类。11.根据申请专利范围第7项所述的语音合成方法,其中该音调波形分类步骤是藉由在各个仅用于比较的频率上对加权振幅特性的音调波形进行比较来将音调波形进行分类。12.根据申请专利范围第7项所述的语音合成方法,其进一步包含音调波形选择步骤,当组合语音时,其用以藉由将相邻的音调波形进行比较来选择将注册于资料库中的音调波形。13.一种用以将复数个音调波形注册至资料库以储存与语音区段相关之资料的音调波形注册装置,该音调波形组成复数个各包含至少一个音素的语音区段,且将被用于对语音区段所组成的语音进行合成,包含:将每个语音区段分解成复数个各具其相位特性之音调波形的语音区段分解构件;将该音调波形的相位特性转换成对每个音调波形一致之相位特性的相位特性转换构件;将该音调波形分类成复数群的音调波形分类构件,其每一群是由复数个形状相同的音调波形所组成;及用以藉由从每群的音调波形中撷取一个音调波形来将音调波形注册于资料库中的音调波形注册构件。14.一种用以将复数个音调波形注册至资料库以储存与语音区段相关之资料的音调波形注册方法,该音调波形组成复数个各包含至少一个音素的语音区段,且将被用于对语音区段所组成的语音进行合成,包含以下步骤:将每个语音区段分解成复数个各具其相位特性之音调波形的语音区段分解步骤;将该音调波形的相位特性转换成对每个音调波形一致之相位特性的相位特性转换步骤;将该音调波形分类成复数群的音调波形分类步骤,其每一群是由复数个形状相同的音调波形所组成;及用以藉由从每群的音调波形中撷取一个音调波形来将音调波形注册于资料库中的音调波形注册步骤。图式简单说明:图1显示根据本发明之语音合成装置之实施例的方块图;图2显示根据本发明之语音合成方法之实施例的流程图;图3显示音调波形之范例的说明图;图4显示将本发明之语音合成装置之实施例中的语音区段分解成音调波形的处理范例说明图;图5显示将本发明语音合成装置之第一实施例中之音调波形的相位特性转换成一致相位特性的处理范例说明图;图6为音调波形之相位特性的范例说明图;图7显示从本发明之语音合成装置之实施例中的音调波形来重组语音区段的处理范例说明图;图8显示在本发明之语音合成装置的第二实施例中产生一致之相位特性的处理范例说明图;图9显示将本发明语音合成装置之第二实施例中之音调波形的相位特性进行转换的处理范例说明图;图10显示根据本发明之语音合成装置之第三实施例中的各个音素类型,将音调波形进行分类的处理范例说明图;图11显示本发明语音合成装置的之第四实施例中之频率处的加权音调波形处理范例说明图;图12显示选择本发明语音合成装置之第五实施例中之音调波形代表的处理范例流程图;图13为显示比较音调波形之范例的一个说明图,该音调波形将位于本发明语音合成装置之第五实施例中的邻近。
地址 日本