发明名称 多模型自适应和语音识别装置及其方法
摘要 本发明包括以下步骤:选择说话人指定的某一个模型;从说话人的输入语音中提取用于语音模型的特征向量;用所设定的发音信息列模型和基本语音模型对所提取的特征向量进行自适应,并将结果存储在所述多个模型中说话人所指定的模型中,且设定指示为是否已进行自适应的标志;从说话人为了语音识别而输入的语音中提取特征向量;读取设定于多元自适应模型中的标志,并只选择已进行自适应的模型;依次比较从说话人的输入语音中提取的特征向量与通过读取标志而选择的模型,从而计算自适应值的相似度;对全体模型完成相似度计算后,选择具有最大相似度值的一个模型,并通过解码来进行语音识别。
申请公布号 CN102270450A 申请公布日期 2011.12.07
申请号 CN201110097861.2 申请日期 2011.04.19
申请人 株式会社曙飞电子 发明人 李成燮
分类号 G10L15/02(2006.01)I;G10L15/18(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京鸿元知识产权代理有限公司 11327 代理人 陈英俊
主权项 一种多模型自适应装置,其特征在于,包括:模型编号选择单元,用于选择说话人为了语音自适应而指定的某一个模型;特征向量提取单元,用于从为了自适应而输入的说话人语音中提取特征向量;自适应处理单元,适用所设定的发音信息列模型和基本语音模型的标准值以对说话人的语音进行自适应之后,将结果存储到说话人指定的模型中,并对已进行自适应的模型设定标志;多元自适应模型,由多个模型组成,根据说话人的指定且按照特性进行自适应的语音存储到该多元自适应模型中。
地址 韩国京畿道