主权项 |
1.一种基于短时连续非负矩阵分解的语音时长调整方法,其特征在于将一段语音资料调整出不同的播放速度,包括如下步骤:第一步,获取原语音段y(n)的幅度谱M,并对M进行短时连续非负矩阵分解,获得基矩阵A与编码矩阵X;第二步,对编码矩阵X按时长调整比例进行线性内插,获得内插后的新编码矩阵<img file="FDA00002121667300011.GIF" wi="62" he="45" />第三步,由基矩阵A与新编码矩阵<img file="FDA00002121667300012.GIF" wi="37" he="44" />合成新幅度谱<img file="FDA00002121667300013.GIF" wi="79" he="44" />即<img file="FDA00002121667300014.GIF" wi="175" he="44" />第四步,使用波形估计算法从<img file="FDA00002121667300015.GIF" wi="43" he="45" />迭代重构时长调整后的语音段<img file="FDA00002121667300016.GIF" wi="107" he="44" /> |