一种基于PSM变调的语音识别及其还原方法及其装置,申请号CN201110183006.3-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种基于PSM变调的语音识别及其还原方法及其装置
摘要	本发明公开一种基于PSM变调的语音识别及其还原方法及其装置，利用语音的基频特性估计变调后伸缩系数，并对美频率倒谱系数提取算法进行了改进，即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中，使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法，计算语音之间的相似度。同时，还能利用该估计的伸缩系数将变调后的语音还原为原语音。
申请公布号	CN102354496B	申请公布日期	2013.08.21
申请号	CN201110183006.3	申请日期	2011.07.01
申请人	中山大学	发明人	王泳;黄继武
分类号	G10L17/00(2013.01)I	主分类号	G10L17/00(2013.01)I
代理机构	广州粤高专利商标代理有限公司 44102	代理人	禹小明
主权项	一种基于PSM语音变调的识别方法，其特征在于，所述方法为：输入测试语音和参考语音，所述参考语音为经过PSM变调后的语音，所述测试语音为未经PSM变调的语音；提取测试语音的美频率倒谱系数；提取所述测试语音和参考语音的基频，计算出伸缩系数；对美频率倒谱系数的提取算法采用所述伸缩系数进行线性插值伸缩，得出改进型提取算法，用所述改进型提取算法提取所述参考语音的美频率倒谱系数，根据所述参考语音的美频率倒谱系数与所述测试语音的美频率倒谱系数作匹配计算，若所得值大于预设值则识别为不同音源的语音，若不大于预设值，则识别为同一音源的语音；计算所述伸缩系数的估计方法为：α′=mean(Fr)/mean(Ft)，其中α′为所述伸缩系数，mean（Fr）为所述参考语音的基频值的平均值，mean（Ft）为所述测试语音的基频值的平均值。
地址	510275 广东省广州市新港西路135号

您可能感兴趣的专利

电器的设置辅助系统

一种治疗须发早白药茶

超声喷雾微波干燥制备纳米三氧化钨粉末的装置及方法

墨水供给系统、记录装置、记录头及液体供给系统

视觉障碍者行走支援装置

N－(2－(2－羟基乙基)苯基)－三氟乙酰偕氯代亚胺及其合成方法

管接头结构及其制造方法

叠层陶瓷电子部件的制造方法

自行车曲拐轴

用儿茶素保护受UV－B辐射的生物体

Container with anti-clog pouring spout

ANTENNA, RADIO DEVICE AND RADIO REPEATER

Lan telephone system

ADHESIVE FORMULATIONS

DIRECT QUANTITATION OF LOW COPY NUMBER RNA

SYNTHETIC NONWOVEN WIPING FABRIC.

METHOD FOR THE PRODUCTION OF A METAL-CERAMIC SUBSTRATE, PREFERABLY A COPPER-CERAMIC SUBSTRATE

Data structure and method for managing multiple ordered sets

ACTIVE AGENTS COMBINATION EXHIBITING INSECTICIDAL AND ACARICIDE PROPERTIES

A METHOD AND A DEVICE FOR DETERMINING THE DRY WEIGHT OF A PATIENT WITH KIDNEY FAILURE