一种可任意调节的语音自然变声方法及装置,申请号CN201210039318.1-传众专利搜索

发明名称	一种可任意调节的语音自然变声方法及装置
摘要	本发明公开一种可任意调节的语音自然变声方法及装置，所述方法将语音信号在声道中进行建模，随后求出发音的系统模型，即声道的模型，之后再改变声道的模型，最后在新的声道模型中还原出语音信号，这个新输出的语音信号即为变声后的信号。装置包括电源模块、输入输出模块、控制模块和处理模块，控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块输入声音信号，并转化为数字信号，送入处理模块中，处理模块根据输入的参数对信号进行处理，形成变声信号后送入输入输出模块，再转化为模拟信号，并由音箱输出。本发明使变声后的信号可以有很自然的声音效果，且可任意调节。本发明中装置简单，容易实现，且设备成本低廉，使用方便。
申请公布号	CN102592590A	申请公布日期	2012.07.18
申请号	CN201210039318.1	申请日期	2012.02.21
申请人	华南理工大学	发明人	宁更新;刘元庆;韦岗;杨萃
分类号	G10L13/02(2006.01)I;G10L19/00(2006.01)I	主分类号	G10L13/02(2006.01)I
代理机构	广州粤高专利商标代理有限公司 44102	代理人	何淑珍
主权项	1.一种可任意调节的语音自然变声方法，其特征在于包括如下步骤：步骤一、建立通过声道后的语音信号的声道模型：声带振动产生一个激励，通过口腔后形成一个语音信号G[n]，使G[n]通过一个声道，输出一个信号y[n]，该信号的声道模型为：<maths num="0001"><![CDATA[<math><mrow><mi>y</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>=</mo><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>+</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式1)，公式1中，系数a<sub>i</sub>即为声道模型的参数，G[n]表示为：<maths num="0002"><![CDATA[<math><mrow><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式2)；步骤二、求出声道的系统传递函数：对语音信号G[n]进行Z变换，对上式两边同时进行Z变换，得到如下结果：<maths num="0003"><![CDATA[<math><mrow><mi>G</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><mi>Y</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></math>]]></maths>(公式3)，将公式3作变换，将等号左边写为输出与输入函数的比值形式，即得到下式<maths num="0004"><![CDATA[<math><mrow><mfrac><mrow><mi>Y</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow><mrow><mi>G</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式4)，公式4即为该声道系统函数H(z)<maths num="0005"><![CDATA[<math><mrow><mi>H</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式5)；步骤三、求出声道的系统函数的极点：根据上面的表达式，求H(z)的极点即为求下面方程的根，<maths num="0006"><![CDATA[<math><mrow><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(公式6)令<maths num="0007"><![CDATA[<math><mrow><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mi>a</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup><mo>=</mo><munderover><mi>Π</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>=</mo><mn>0</mn></mrow></math>]]></maths>(公式7)解该方程，可以得到一组复数根<img file="FDA0000137078130000022.GIF" wi="487" he="94" />即为系统函数H(z)的极点；步骤四、根据输入的变声参数，对原声道系统的极点进行移位，在极点移位后，仍保持各次谐波的关系，故而在进行极点移位时，针对不同的极点要附加不同的移动距离，移位的过程如下，首先利用数字信号处理的估算方法算出基波的频率ω<sub>0</sub>，之后按照如下的方法将极点进行移位：<maths num="0008"><![CDATA[<math><mrow><msub><mover><mi>ϵ</mi><mo>^</mo></mover><mi>k</mi></msub><mo>=</mo><msub><mi>λr</mi><mi>k</mi></msub><msup><mi>e</mi><mrow><mi>j</mi><msub><mi>ω</mi><mi>k</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>+</mo><mfrac><msub><mi>ω</mi><mi>k</mi></msub><msub><mi>ω</mi><mn>0</mn></msub></mfrac><mi>Δ</mi><mo>)</mo></mrow><mi></mi></mrow></msup><mi>k</mi><mo>=</mo><mn>1,2</mn><mo>.</mo><mo>.</mo><mo>.</mo><mi>N</mi></mrow></math>]]></maths>(公式8)<img file="FDA0000137078130000024.GIF" wi="42" he="76" />即为系统的新极点，N为正整数，其中，Δ为输入的语音变声参数，λ为音量调节参数，这样，在移位的过程中既调整了语音频率，又调整了音量大小；步骤五、利用移位后的极点<img file="FDA0000137078130000025.GIF" wi="42" he="76" />重新恢复出新的<img file="FDA0000137078130000026.GIF" wi="136" he="76" />为新的语音声道的系数，这样，新的声道模型得以建立，由于各新极点即是方程<img file="FDA0000137078130000027.GIF" wi="260" he="133" />的根，则得到下式：<maths num="0009"><![CDATA[<math><mrow><munderover><mi>Π</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mover><mi>ϵ</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mn>1</mn></mrow></msup><mo>)</mo></mrow><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></math>]]></maths>(公式10)从而得到新声道的系统函数<maths num="0010"><![CDATA[<math><mrow><mover><mrow><mi>H</mi><mrow><mo>(</mo><mi>z</mi><mo>)</mo></mrow></mrow><mo>^</mo></mover><mo>=</mo><mfrac><mn>1</mn><mrow><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>0</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><msup><mi>z</mi><mrow><mo>-</mo><mi>i</mi></mrow></msup></mrow></mfrac></mrow></math>]]></maths>(公式11)；步骤六、将激励即语音信号G[n]输入新声道，得到新的语音信号模型，即为变声后的语音信号，最终得到变声后的语音信号为：<maths num="0011"><![CDATA[<math><mrow><mover><mrow><mi>y</mi><mo>[</mo><mi>n</mi><mo>]</mo></mrow><mo>^</mo></mover><mo>=</mo><mi>G</mi><mo>[</mo><mi>n</mi><mo>]</mo><mo>+</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>N</mi></munderover><msub><mover><mi>a</mi><mo>^</mo></mover><mi>i</mi></msub><mi>y</mi><mo>[</mo><mi>n</mi><mo>-</mo><mi>i</mi><mo>]</mo></mrow></math>]]></maths>(公式12)。
地址	510640 广东省广州市天河区五山路381号