发明名称 一种汉语耳语音的基频估计方法
摘要 本发明公开了一种汉语耳语音的基频估计方法,具体步骤包括:建立一个语料一致的耳语音和正常语音数据库;分别提取耳语音的LPCC参数L<sub>w</sub>、正常语音的LPCC参数L<sub>n</sub>和基频参数F0,并按照L<sub>w</sub>和L<sub>n</sub>进行DTW对齐;将正常语音的F0在100~300Hz之间按照5Hz一个间隔划分,共产生40个区间;将所有对齐后的矢量按照正常语音F0的大小归属到每个区间中,将每个区间中的所有耳语音LPCC矢量训练为一个GMM模型,同时将该区间中所有耳语音LPCC矢量与正常语音F0参数构成的联合矢量训练为一个GMM模型并得到一个估计函数,共40个估计函数;提取耳语音的LPCC参数,将其与每一个GMM模型匹配,搜索最佳匹配的模型,然后采用该模型的估计函数估计耳语音的F0值。本发明能够估计耳语音的基频,有效解决汉语耳语音由于基频信息缺失带来的困难。
申请公布号 CN104376850A 申请公布日期 2015.02.25
申请号 CN201410705012.4 申请日期 2014.11.28
申请人 苏州大学 发明人 陈雪勤;刘正;赵鹤鸣;俞一彪
分类号 G10L25/24(2013.01)I;G10L25/78(2013.01)I;G10L15/06(2013.01)I 主分类号 G10L25/24(2013.01)I
代理机构 苏州创元专利商标事务所有限公司 32103 代理人 陶海锋
主权项  一种汉语耳语音的基频估计方法,其特征在于,包括如下步骤:(1)建立一个语料一致的耳语音和正常语音数据库,使得数据库中,耳语音和正常语音的说话人、语音内容、语序完全一致;(2)分别提取耳语音的线性预测倒谱参数L<sub>w</sub>、正常语音的线性预测倒谱参数L<sub>n</sub>和基频参数F0,并按照L<sub>w</sub>和L<sub>n</sub>进行动态时间规整对齐;(3)将正常语音的F0在100~300Hz之间按照5Hz一个间隔划分,共产生40个区间;(4)将所有对齐后的矢量按照正常语音F0的大小归属到每个区间中,将每个区间中的所有耳语音线性预测倒谱矢量训练为一个高斯混合模型,同时将该区间中所有耳语音线性预测倒谱矢量与正常语音F0参数构成的联合矢量训练为一个高斯混合模型并得到一个估计函数,共40个估计函数;(5)提取耳语音的线性预测倒谱参数,将其与每一个高斯混合模型匹配,搜索最佳匹配的模型,然后采用该模型的估计函数估计耳语音的F0值。
地址 215137 江苏省苏州市相城区济学路8号
您可能感兴趣的专利