发明名称 一种可任意调节的语音自然变声方法及装置
摘要 本发明公开一种可任意调节的语音自然变声方法及装置,所述方法将语音信号在声道中进行建模,随后求出发音的系统模型,即声道的模型,之后再改变声道的模型,最后在新的声道模型中还原出语音信号,这个新输出的语音信号即为变声后的信号。装置包括电源模块、输入输出模块、控制模块和处理模块,控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块输入声音信号,并转化为数字信号,送入处理模块中,处理模块根据输入的参数对信号进行处理,形成变声信号后送入输入输出模块,再转化为模拟信号,并由音箱输出。本发明使变声后的信号可以有很自然的声音效果,且可任意调节。本发明中装置简单,容易实现,且设备成本低廉,使用方便。
申请公布号 CN102592590A 申请公布日期 2012.07.18
申请号 CN201210039318.1 申请日期 2012.02.21
申请人 华南理工大学 发明人 宁更新;刘元庆;韦岗;杨萃
分类号 G10L13/02(2006.01)I;G10L19/00(2006.01)I 主分类号 G10L13/02(2006.01)I
代理机构 广州粤高专利商标代理有限公司 44102 代理人 何淑珍
主权项 1.一种可任意调节的语音自然变声方法,其特征在于包括如下步骤:步骤一、建立通过声道后的语音信号的声道模型:声带振动产生一个激励,通过口腔后形成一个语音信号G[n],使G[n]通过一个声道,输出一个信号y[n],该信号的声道模型为:<maths num="0001"><![CDATA[<math><mrow><mi>y</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>=</mo><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式1),公式1中,系数a<sub>i</sub>即为声道模型的参数,G[n]表示为:<maths num="0002"><![CDATA[<math><mrow><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式2);步骤二、求出声道的系统传递函数:对语音信号G[n]进行Z变换,对上式两边同时进行Z变换,得到如下结果:<maths num="0003"><![CDATA[<math><mrow><mi>G</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>Y</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></math>]]></maths>(公式3),将公式3作变换,将等号左边写为输出与输入函数的比值形式,即得到下式<maths num="0004"><![CDATA[<math><mrow><mfrac><mrow><mi>Y</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow><mrow><mi>G</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式4),公式4即为该声道系统函数H(z)<maths num="0005"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式5);步骤三、求出声道的系统函数的极点:根据上面的表达式,求H(z)的极点即为求下面方程的根,<maths num="0006"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(公式6)令<maths num="0007"><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup><mo>=</mo><munderover><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(公式7)解该方程,可以得到一组复数根<img file="FDA0000137078130000022.GIF" wi="487" he="94" />即为系统函数H(z)的极点;步骤四、根据输入的变声参数,对原声道系统的极点进行移位,在极点移位后,仍保持各次谐波的关系,故而在进行极点移位时,针对不同的极点要附加不同的移动距离,移位的过程如下,首先利用数字信号处理的估算方法算出基波的频率ω<sub>0</sub>,之后按照如下的方法将极点进行移位:<maths num="0008"><![CDATA[<math><mrow><msub><mover><mi>&epsiv;</mi><mo>^</mo></mover><mi>k</mi></msub><mo>=</mo><msub><mi>&lambda;r</mi><mi>k</mi></msub><msup><mi>e</mi><mrow><mi>j</mi><msub><mi>&omega;</mi><mi>k</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mfrac><msub><mi>&omega;</mi><mi>k</mi></msub><msub><mi>&omega;</mi><mn>0</mn></msub></mfrac><mi>&Delta;</mi><mo>)</mo></mrow><mi></mi></mrow></msup><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>.</mo><mo>.</mo><mo>.</mo><mi>N</mi></mrow></math>]]></maths>(公式8)<img file="FDA0000137078130000024.GIF" wi="42" he="76" />即为系统的新极点,N为正整数,其中,Δ为输入的语音变声参数,λ为音量调节参数,这样,在移位的过程中既调整了语音频率,又调整了音量大小;步骤五、利用移位后的极点<img file="FDA0000137078130000025.GIF" wi="42" he="76" />重新恢复出新的<img file="FDA0000137078130000026.GIF" wi="136" he="76" />为新的语音声道的系数,这样,新的声道模型得以建立,由于各新极点即是方程<img file="FDA0000137078130000027.GIF" wi="260" he="133" />的根,则得到下式:<maths num="0009"><![CDATA[<math><mrow><munderover><mi>&Pi;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mover><mi>&epsiv;</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></math>]]></maths>(公式10)从而得到新声道的系统函数<maths num="0010"><![CDATA[<math><mrow><mover><mrow><mi>H</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow><mo>^</mo></mover><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式11);步骤六、将激励即语音信号G[n]输入新声道,得到新的语音信号模型,即为变声后的语音信号,最终得到变声后的语音信号为:<maths num="0011"><![CDATA[<math><mrow><mover><mrow><mi>y</mi><mo>[</mo><mi>n</mi><mo>]</mo></mrow><mo>^</mo></mover><mo>=</mo><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>+</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式12)。
地址 510640 广东省广州市天河区五山路381号