发明名称 一种基于发音节奏的语音评测方法及装置
摘要 本发明涉及一种基于发音节奏的语音评测方法及装置,该装置包括:GMM模型获取单元用于从被评测语音中选出训练数据,提取出所述训练数据的节奏特征参数进行训练得到GMM模型;似然度获取单元提取被评测语音的节奏特征参数作为所述GMM模型的输入,经GMM模型匹配获取相应的似然度值;评测模型获取单元用于所述似然度经过训练评测模型,根据所述评测模型对被评测语音的发音节奏进行评测。本申请所提出的技术方案用于辅助语言教学,尤其是对外汉语的教学,满足了学生学语言的需要。另外,能及时发现学生的语音节奏中的偏误并给予他们有效的反馈,将会提高他们的语言学效率。尤其在于日本学生学汉语方面。
申请公布号 CN103021226B 申请公布日期 2015.02.11
申请号 CN201210473420.2 申请日期 2012.11.20
申请人 北京语言大学 发明人 张劲松;时书菊;解焱陆
分类号 G09B19/06(2006.01)I 主分类号 G09B19/06(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 郭智
主权项 一种基于发音节奏的语音评测装置,其特征在于,该装置包括:GMM模型获取单元,用于从被评测语音中选出训练数据,提取出所述训练数据的节奏特征参数进行训练得到GMM模型;似然度获取单元,提取被评测语音的节奏特征参数作为所述GMM模型的输入,经GMM模型匹配获取相应的似然度值;评测模型获取单元,包括评测模型模块,所述评测模型模块用于所述似然度值经过训练获取评测模型,根据所述评测模型对被评测语音的发音节奏进行评测;所述GMM模型获取单元中的节奏特征参数包括:%V、ΔV、rPVI、nPVI和ΔE;其中,所述%V为在一句话中所有元音的时长占总时长的比例;所述ΔV为在一句话中元音时长的标准差;所述ΔE为一句话中辅音/元音能量值的标准差;所述ΔE表达式为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>&Delta;E</mi><mo>=</mo><msqrt><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>E</mi><mi>i</mi></msub><mo>-</mo><mover><mi>E</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mn>2</mn></msup></msqrt></mrow>]]></math><img file="FDA0000562482580000011.GIF" wi="456" he="160" /></maths>其中,n表示一句话中总的元音或者辅音个数;i表示第i个元音或者辅音;E<sub>i</sub>表示第i个元音或者辅音的能量值;<img file="FDA0000562482580000014.GIF" wi="81" he="61" />表示一句话中元音或者辅音能量的平均值;所述rPVI为相邻两元音段或辅音段之间的时长差的平均值;所述rPVI表达式为:<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>rPVI</mi><mo>=</mo><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>|</mo><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>]</mo></mrow>]]></math><img file="FDA0000562482580000012.GIF" wi="571" he="151" /></maths>其中,k表示第K个元音或者辅音段;m表示一句话中元音或者辅音段的总个数;d<sub>k</sub>表示第k个元音或者辅音段的时长;所述nPVI为相邻两元音段或辅音段之间的时长差占单个片段时长的比例的平均值;所述nPVI表达式为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mi>nPVI</mi><mo>=</mo><mn>100</mn><mo>*</mo><mo>[</mo><munderover><mi>&Sigma;</mi><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mrow><mi>m</mi><mo>-</mo><mn>1</mn></mrow></munderover><mo>|</mo><mfrac><mrow><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub></mrow><mrow><mrow><mo>(</mo><msub><mi>d</mi><mi>k</mi></msub><mo>-</mo><msub><mi>d</mi><mrow><mi>k</mi><mo>-</mo><mn>1</mn></mrow></msub><mo>)</mo></mrow><mo>/</mo><mn>2</mn></mrow></mfrac><mo>|</mo><mo>/</mo><mrow><mo>(</mo><mi>m</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>]</mo><mo>.</mo></mrow>]]></math><img file="FDA0000562482580000013.GIF" wi="857" he="378" /></maths>
地址 100083 北京市海淀区学院路15号
您可能感兴趣的专利