一种病理嗓音的识别方法,申请号CN201410027836.0-传众专利搜索

发明名称	一种病理嗓音的识别方法
摘要	本发明公开了一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，所述特征参数输入模块和特征优化模块对病理嗓音特征库进行采样和优化淘选，所述病理嗓音识别模块根据特征参数计算匹配度Match，所述匹配判断模块用以统计识别结果，所述内容呈现模块用以输出。本发明通过EM算法，消掉隐变量，通过特征优化组合参数，经过分类器，再运用基于期望值最大化的高斯混合模型（GMM-EM）对优化后的嗓音特征进行有效识别，明显提高正确识别率。
申请公布号	CN103778913A	申请公布日期	2014.05.07
申请号	CN201410027836.0	申请日期	2014.01.22
申请人	苏州大学	发明人	张晓俊;曹毅;陶智;黄程韦;吴迪;肖仲喆
分类号	G10L15/02(2006.01)I;G10L15/10(2006.01)I	主分类号	G10L15/02(2006.01)I
代理机构	南京经纬专利商标代理有限公司 32200	代理人	曹毅
主权项	1.一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，其特征在于，所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型（GMM-EM）建立单元、模型训练单元和语音识别单元，其中所述模型（GMM-EM）建立单元和模型训练单元包括以下步骤：步骤2.1）确定高斯混合模型代表公式，如下：<img file="889996DEST_PATH_IMAGE001.GIF" wi="140" he="38" /><img file="807136DEST_PATH_IMAGE002.GIF" wi="308" he="51" />其中<img file="586873DEST_PATH_IMAGE003.GIF" wi="15" he="24" />，<img file="919766DEST_PATH_IMAGE004.GIF" wi="18" he="24" />，<img file="734138DEST_PATH_IMAGE005.GIF" wi="18" he="24" />分别表示第i个高斯分量的权重、均值向量和方差矩阵，<img file="556600DEST_PATH_IMAGE006.GIF" wi="12" he="15" />表示m维的特征向量，K是高斯模型的分量数目；步骤2.2）E步计算得到初始化参数，计算公式如下：<img file="761317DEST_PATH_IMAGE007.GIF" wi="222" he="62" />j=1,..,K, t=1,…,n；步骤2.3）M步计算更新参数，计算公式如下：<img file="960217DEST_PATH_IMAGE008.GIF" wi="156" he="48" /><img file="629096DEST_PATH_IMAGE009.GIF" wi="146" he="63" /><img file="622460DEST_PATH_IMAGE010.GIF" wi="237" he="60" />；步骤2.4）针对各类病理嗓音种类，提取各种特征参数；步骤2.5）对每类嗓音每种特征参数进行GMM训练，得到训练的GMM矩阵；步骤2.6）运用连接F属性的评估的属性选择的算法对数据进行组合优化，提取出若干个参数；步骤2.7）运用两种分类器，对数据进行进一步特征优化；步骤2.8）将步骤2.7）中提取的特征参数输入训练好的GMM，求其似然度；步骤2.9）根据步骤2.8）算出的似然度，计算各类病理嗓音的匹配概率；步骤2.10）对步骤2.9）求出的各特征参数匹配概率加权求和得总匹配度Match；步骤2.11）将步骤2.9）求得的总匹配度Match和阈值进行比较，如果大于阈值，将进行各特征的贡献率计算，如果小于阈值，将进行计数及送入结束判断；步骤2.12）对步骤2.11）中的总匹配度Match小于阈值且不满足结束条件的嗓音信号送回进行新一轮的训练，如果满足结束条件，则训练结束；所述语音识别单元包括以下步骤：步骤2.13）输入识别嗓音信号进行特征提取；步骤2.14）运用连接F属性的评估的属性选择的算法对数据进行组合优化，提取出若干参数；步骤2.15）运用两种分类器，对数据进行进一步特征优化；步骤2.16）加载步骤2.12）中训练好的识别模型；步骤2.17）将步骤2.14）中提取的特征与加载好的识别模型进行匹配；步骤2.18）若匹配，则识别结束，若不匹配则载入下一个训练好的模型，并转入步骤2.13）。
地址	215000 江苏省苏州市工业园区仁爱路199号