发明名称 音调原型波形借助于时间同步波形内插的语音合成
摘要 一种用音调原型波形借助于时间同步波形内插(TSWI)的语音合成方法,其中从一语音信号或余量信号当中提取一个或多个音调原型(300)。该提取处理执行时使得原型在边界处具有最小能量。各个原型循环移位以便与原始信号在时间上同步。对各个所提取的原型加上一相对于前一次提取的原型的线性相移,以便使相继的所提取原型间的跨接相关性为最大(302)。通过对每个取样点的原型进行过取样来构建一二维原型展开表面(303)。对该二维原型展开表面重新取样以生成一个一维经过合成的信号帧,所具有的取样点由根据音调滞后和加到所提取原型上的相移计算得到的逐段连续立方相位轮廓函数定义(305)。可应用一预选滤波器来判断是否对当前帧放弃TSWI技术而采用另一算法。可获得一选择后性能测定结果,并使之与一预定阈值相比较,来判断该TSWI算法是否充分执行。
申请公布号 CN1348582A 申请公布日期 2002.05.08
申请号 CN99815489.X 申请日期 1999.11.12
申请人 高通股份有限公司 发明人 A·达斯;E·L·T·乔依
分类号 G10L19/02 主分类号 G10L19/02
代理机构 上海专利商标事务所 代理人 赵国华
主权项 1.一种用音调原型波形借助于时间同步波形内插的语音合成方法,其特征在于,包括下列步骤:从一信号当中每一帧提取至少一个音调原型;对所提取的音调原型加上一相对于前一次提取的音调原型的相移;就该帧内每一取样点对音调原型进行过取样;构建一个二维原型展开表面;以及对二维表面重新取样以产生一维合成的信号帧,该重新取样点由逐段连续立方相位轮廓函数定义,该相位轮廓函数是根据音调滞后和加到所提取的音调原型上的调准相移计算得到的。
地址 美国加利福尼亚州