发明名称 语音识别方法及其系统
摘要 一种为语音信号建立语音模型的方法及其系统,该方法包括:接收训练样本;选定所述训练样本中的一个矢量,并计算所述矢量相对于预设GMM的最大似然值;选择预设数量的GMM,并将这些GMM中包含的PDF的参数建立成高斯参数表,其中GMM的选择是根据其对应的最大似然值进行的;将所述选定的GMM对应的最大似然值分配于HMM中的一个状态,其中,所述最大似然值即为所述矢量为所述HMM状态的概率;以及HMM状态组成序列,生成HMM状态模型,以执行对语音信号的识别。因此,在建立语音模型以进行语音识别时,不需要输入语音信号对应的,可被计算机理解的信息,同时不需要额外的存储空间存储这些信息。从而,在实际应用中,操作更方便,占用的存储空间更少。
申请公布号 CN105810192A 申请公布日期 2016.07.27
申请号 CN201410854831.5 申请日期 2014.12.31
申请人 展讯通信(上海)有限公司 发明人 孙廷玮;林福辉
分类号 G10L15/06(2013.01)I;G10L15/14(2006.01)I 主分类号 G10L15/06(2013.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 蔡杰赟;骆苏华
主权项 一种为语音信号建立识别模型的方法,其特征在于,包括:接收所述语音信号的训练样本;计算所述训练样本中的矢量相对于多个预设高斯混合模型的最大似然值;在所述多个预设高斯混合模型中选择第一组高斯混合模型,其中所述第一组高斯混合模型的选择是根据所述多个预设高斯混合模型对应的最大似然值进行的;将选定的所述第一组高斯混合模型对应的最大似然值分别分配于隐马尔可夫模型中的状态,其中,每个所述最大似然值即为所述矢量为对应状态的概率;以及,将所述训练样本的多个矢量对应的状态组成序列,生成隐马尔可夫状态模型。
地址 201203 上海市浦东新区浦东张江高科技园区祖冲之路2288弄展讯中心1号楼