发明名称 一种用于语种识别的建模方法及装置
摘要 本发明的实施例提出了一种用于语种识别的建模方法,包括输入语音数据,对语音数据预处理得到特征序列,将特征矢量映射为超矢量,对超矢量进行投影补偿,通过支持向量机算法建立训练语种模型;对待测语音采用上述步骤得到待测超矢量,对待测超矢量进行投影补偿,利用语种模型对所述待测超矢量打分,识别待测语音的语言种类。本发明实施例还提出了一种用于语种识别的建模装置包括语音预处理模块、特征提取模块、多坐标系原点选择模块、特征矢量映射模块、子空间提取模块、子空间投影补偿模块、训练模块和识别模块。根据本发明实施例提供的方法及装置,去除高维统计量中对识别无效的信息,提高语种识别的正确率,降低在集成电路上的运算复杂度。
申请公布号 CN101894548A 申请公布日期 2010.11.24
申请号 CN201010207237.9 申请日期 2010.06.23
申请人 清华大学 发明人 何亮;张卫强;刘加
分类号 G10L15/02(2006.01)I;G10L15/06(2006.01)I;G10L21/02(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京市立方律师事务所 11330 代理人 马佑平
主权项 一种用于语种识别的建模方法,其特征在于,包括如下步骤:输入语音数据,对所述语音数据预处理得到特征序列,所述特征序列由特征向量组成,并根据坐标系选择算法和特征矢量映射算法,将所述特征矢量映射为超矢量,对所述超矢量进行投影和补偿,通过支持向量机算法建立并训练语种模型;输入待测语音,对所述待测语音预处理得到特征序列,所述特征序列由特征向量组成,并根据坐标系选择算法和特征矢量映射算法,将所述特征矢量映射为待测超矢量,对所述待测超矢量进行投影和补偿,利用所述语种模型对所述待测超矢量打分,识别所述待测语音的语言种类。
地址 100084 北京市100084-82信箱