主权项 |
一种基于发音节奏的语音评测装置,其特征在于,该装置包括:GMM模型获取单元,用于从被评测语音中选出训练数据,提取出所述训练数据的节奏特征参数进行训练得到GMM模型;似然度获取单元,提取被评测语音的节奏特征参数作为所述GMM模型的输入,经GMM模型匹配获取相应的似然度值;评测模型获取单元,包括评测模型模块,所述评测模型模块用于所述似然度值经过训练获取评测模型,根据所述评测模型对被评测语音的发音节奏进行评测;所述GMM模型获取单元中的节奏特征参数包括:%V、ΔV、rPVI、nPVI和ΔE;其中,所述%V为在一句话中所有元音的时长占总时长的比例;所述ΔV为在一句话中元音时长的标准差;所述ΔE为一句话中辅音/元音能量值的标准差;所述ΔE表达式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>ΔE</mi><mo>=</mo><msqrt><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>E</mi><mi>i</mi></msub><mo>-</mo><mover><mi>E</mi><mo>‾</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mrow>]]></math><img file="FDA0000562482580000011.GIF" wi="456" he="160" /></maths>其中,n表示一句话中总的元音或者辅音个数;i表示第i个元音或者辅音;E<sub>i</sub>表示第i个元音或者辅音的能量值;<img file="FDA0000562482580000014.GIF" wi="81" he="61" />表示一句话中元音或者辅音能量的平均值;所述rPVI为相邻两元音段或辅音段之间的时长差的平均值;所述rPVI表达式为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>rPVI</mi><mo>=</mo><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>|</mo><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>]</mo></mrow>]]></math><img file="FDA0000562482580000012.GIF" wi="571" he="151" /></maths>其中,k表示第K个元音或者辅音段;m表示一句话中元音或者辅音段的总个数;d<sub>k</sub>表示第k个元音或者辅音段的时长;所述nPVI为相邻两元音段或辅音段之间的时长差占单个片段时长的比例的平均值;所述nPVI表达式为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>nPVI</mi><mo>=</mo><mn>100</mn><mo>*</mo><mo>[</mo><munderover><mi>Σ</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mfrac><mrow><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow><mrow><mrow><mo>(</mo><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></mfrac><mo>|</mo><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>]</mo><mo>.</mo></mrow>]]></math><img file="FDA0000562482580000013.GIF" wi="857" he="378" /></maths> |