发明名称 一种基于共有鉴别性子空间映射的语种识别方法及装置
摘要 本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到共有鉴别性子空间,得到与所述高斯超向量对应的低维向量,其中,所述共有鉴别性子空间是预先用多个语种的语音数据建立的;以及分别计算所述低维向量在多个支持向量机SVM模型上的得分,根据多个得分识别出所述语种,其中,所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的,每个SVM模型对应一个语种。相比于直接对高斯超向量进行建模,本发明的语种识别方法由于其低维和鉴别性,训练速度更快,识别性能有了明显提高。
申请公布号 CN103077709B 申请公布日期 2015.09.09
申请号 CN201210587263.8 申请日期 2012.12.28
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 周若华;颜永红;王宪亮;刘建
分类号 G10L15/14(2006.01)I 主分类号 G10L15/14(2006.01)I
代理机构 北京亿腾知识产权代理事务所 11309 代理人 陈霁
主权项 一种基于共有鉴别性子空间映射的语种识别方法,包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到共有鉴别性子空间,得到与所述高斯超向量对应的低维向量,其中,所述共有鉴别性子空间是预先用多个语种的语音数据建立的;以及分别计算所述低维向量在多个支持向量机SVM模型上的得分,根据多个得分识别出所述语种,其中,所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的,每个SVM模型对应一个语种;其中,所述共有鉴别性子空间是通过下列步骤得到的:提取多个语种的多个语音数据的语音特征;根据所述语音特征得到每个语音数据的高斯超向量;计算每个语种的高斯超向量均值;根据所述高斯超向量得到每个语种的标准正交基;将每个语种的高斯超向量均值分别映射到其他多个语种的标准正交基上,得到每个语种对应于其他语种的冗余向量;根据所述冗余向量和每个语种的高斯超向量得到共有向量集;以及根据所述共有向量集得到所述共有鉴别性子空间;其中,所述根据所述冗余向量和每个语种的高斯超向量得到共有向量集的步骤包括:将每个语种的高斯超向量均值减去对应的冗余向量,得到每个语种对应于其他语种的共有向量;以及将所述共有向量按列拼接得到共有向量集。
地址 100190 北京市海淀区北四环西路21号