主权项 |
基于共振峰频率的汉语普通话单韵母语音可视化方法,其特征在于:包括以下步骤:第一步:对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率;第二步:采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;第三步:利用共振峰频率将不同发音映射为不同色彩方面,采用以下公式: <mrow> <mi>r</mi> <mo>=</mo> <mn>0.9</mn> <mo>*</mo> <mrow> <mo>(</mo> <mn>0.0006</mn> <mo>*</mo> <msup> <mn>3</mn> <mrow> <mn>10</mn> <mo>*</mo> <mfrac> <mrow> <mi>F</mi> <mn>1</mn> </mrow> <mrow> <mi>F</mi> <mn>2</mn> </mrow> </mfrac> </mrow> </msup> <mo>+</mo> <mn>0.002</mn> <mo>*</mo> <msup> <mn>5</mn> <mfrac> <mrow> <mi>F</mi> <mn>3</mn> </mrow> <mrow> <mi>F</mi> <mn>2</mn> </mrow> </mfrac> </msup> <mo>)</mo> </mrow> </mrow> <mrow> <mi>G</mi> <mo>=</mo> <mn>0.02</mn> <mo>*</mo> <msup> <mn>3</mn> <mfrac> <mrow> <mi>F</mi> <mn>3</mn> </mrow> <mrow> <mi>F</mi> <mn>2</mn> </mrow> </mfrac> </msup> <mo>+</mo> <mn>0.0003</mn> <mo>*</mo> <msup> <mn>80</mn> <mfrac> <mrow> <mi>F</mi> <mn>3</mn> <mo>-</mo> <mi>F</mi> <mn>1</mn> </mrow> <mn>2000</mn> </mfrac> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>B</mi> <mo>=</mo> <mn>0.0012</mn> <mo>*</mo> <msup> <mn>50</mn> <mfrac> <mrow> <mi>F</mi> <mn>3</mn> <mo>-</mo> <mi>F</mi> <mn>1</mn> </mrow> <mn>2000</mn> </mfrac> </msup> </mrow>其中,F1、F2、F3分别为每帧语音信号的前三个共振峰频率;第四步:对第三步所求出的RGB进行如下修正: <mrow> <mi>r</mi> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mi>R</mi> <mo>,</mo> <mi>R</mi> <mo>≤</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> <mo>,</mo> <mi>R</mi> <mo>></mo> <mn>1</mn> </mtd> </mtr> </mtable> </mfenced> </mrow> <mrow> <mi>g</mi> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mi>G</mi> <mo>,</mo> <mi>G</mi> <mo>≤</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> <mo>,</mo> <mi>G</mi> <mo>></mo> <mn>1</mn> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>b</mi> <mo>=</mo> <mfenced open='{' close=''> <mtable> <mtr> <mtd> <mi>B</mi> <mo>,</mo> <mi>B</mi> <mo>≤</mo> <mn>1</mn> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> <mo>,</mo> <mi>B</mi> <mo>></mo> <mn>1</mn> </mtd> </mtr> </mtable> </mfenced> </mrow>第五步:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。 |