发明名称 一种耳语音特征提取方法及系统
摘要 本发明公开了一种耳语特征提取方法,其特征在于:包括以下步骤:(1)耳语音听觉谱特征表示;(2)特征降维及鲁棒性能分析;所述特征降维及鲁棒性能分析包括三个内容:(a)从高维的听觉谱中提取低维的拓扑结构特征;(b)拓扑结构特征时序性分析;(c)拓扑结构特征稳定性分析;(3)声学模型优化;所述声学模型优化采取先被动学,后主动学的训练机制,提高模型的自适应性能。本发明所述的耳语音特征提取方法将听觉感知谱特征降维得到拓扑结构特征,并通过加强特征的时序权重强化耳语音特征的可区分性。本发明通过两个目标函数在极大化不同语义的特征向量间距离的同时,同时极小化相同语义的特征向量间距离,提高特征的鲁棒性。
申请公布号 CN106571135A 申请公布日期 2017.04.19
申请号 CN201610951988.9 申请日期 2016.10.27
申请人 苏州大学 发明人 陈雪勤;赵鹤鸣
分类号 G10L15/02(2006.01)I;G10L15/14(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 苏州市新苏专利事务所有限公司 32221 代理人 孙怀香
主权项 一种耳语特征提取方法,其特征在于:包括以下步骤:(1)耳语音听觉谱特征表示;耳语音的频谱特征的整体声像结构具有可辨识性,从耳语音听觉谱中提取拓扑结构特征可以提高耳语音识别率,耳语音信号经听觉外周及听神经模型的分解转换,表征为具有不同时频特性的听觉皮层声像特征,并在此基础上,研究基于听觉谱特征的耳语音声调感知方法;(2)特征降维及鲁棒性能分析;所述特征降维及鲁棒性能分析包括三个内容:(a)从高维的听觉谱中提取低维的拓扑结构特征;(b)拓扑结构特征时序性分析;(c)拓扑结构特征稳定性分析;(3)声学模型优化;所述声学模型优化采取先被动学习,后主动学习的训练机制,声学模型在经过初始语音库的被动训练之后生成的初始模型,再由主动学习方式根据识别的反馈结果有针对性地优化模型,提高模型的自适应性能。
地址 215000 江苏省苏州市工业园区仁爱路199号