发明名称 用再生相位信息合成语言的方法和装置
摘要 用再生相位信息合成语言的方法和装置。改进了语言编码系统中使用的频谱幅度和相位表达式。编码器将数字语言信号分成多个帧,估算每帧的基频、发音信息和频谱幅度组。用新估算方法计算每谐波频率的频谱幅度。语言质量和可理解性被改善。解码器接收比特流并重建一系列帧的基频、发音信息和频谱幅度组。用发音信息标明每谐波为发话或非发话,对发话谐波再生一独立相位作为频谱幅度的函数。合成该发话和非发话分量并将其相加产生合成语言。
申请公布号 CN1140871A 申请公布日期 1997.01.22
申请号 CN96104334.2 申请日期 1996.02.22
申请人 数字语音系统公司 发明人 丹尼尔·W·格里芬;约翰·C·哈德威克
分类号 G10L5/00 主分类号 G10L5/00
代理机构 柳沈知识产权律师事务所 代理人 马莹
主权项 1、一种用于从通过将一个语言信号划分成多个帧而产生类型的多个数字比特解码和合成一个合成数字语言信号的方法,确定表示每一帧的多个频带中的每一个频带是否应被合成为发话或非发话频带的发音信息;处理该语言帧以确定表示该频带中频谱幅度的频谱包络线信息,以及对该频谱包络线和发音信息进行量化和编码,其特征在于该用于解码和合成一个合成数字语言信号的方法包括步骤:对该多个比特解码以提供多个帧中每一帧的频谱包络线和发音信息;处理该频谱包络线信息以确定该多个帧中每一帧的再生频谱相位信息;从发音信息确定一个特定帧的频带是否为发话或非发话的;使用再生频谱相位信息合成发话频带的语言分量;在至少一个非发话频带中合成表示语言信号的一个语言分量;以及通过组合发话和非发话频带的被合成语言分量合成该语言信号。
地址 美国马萨诸塞州