主权项 |
1、一种基于能量的音符切分方法,包括步骤:1)对语音信号进行分帧处理;2)计算出每一帧的谐波和能量;其特征在于,还包括如下步骤:3)计算出每一帧的谐波和能量突出度δ,所述突出度δ=SB/SD,其中<math> <mrow> <msub> <mi>S</mi> <mi>B</mi> </msub> <mo>=</mo> <munderover> <mi>Σ</mi> <mrow> <mi>n</mi> <mo>=</mo> <mi>m</mi> </mrow> <mrow> <mi>m</mi> <mo>+</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mo>[</mo> <mi>H</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>H</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>]</mo> </mrow> </math> ,SD=K(α-1)H(m)-0.5(α-1)H(m)(α-1)H(m)β;其中m为当前帧的序号,H(m)为第m帧的谐波和能量,K为整数,其取值范围为10至30,α、β均为经验参数;4)通过比较判断找出整个语音信号中突出度δ的极值点;5)判断突出度δ极值点是否大于1,若判断为是,则把该极值点所在帧作为音符分割点。 |