发明名称 利用双音模型实现混合多国语言的语音辨识装置及方法
摘要 一种利用双音模型实现混合多国语言之语音辨识装置,用以辨识混合多国语言之语音信号为语音指令,包括语音建模器、语音搜寻器以及决策反应器。语音建模器,用以接收混合多语之语音信号,将其转换为语音特征参数与语音模型资料。语音搜寻器,用以搜寻比对语音模型资料,产生候选语音模型资料及其比较相似度,并配合语法规则等以求出最佳的多个候选指令。决策反应器,根据所求得每个候选指令的比较相似度,以预设的信赖度或逻辑关系,决定是否接受该辨识结果或要求重新输入。
申请公布号 TWI224771 申请公布日期 2004.12.01
申请号 TW092108216 申请日期 2003.04.10
申请人 台达电子工业股份有限公司 发明人 李允文
分类号 G10L15/06 主分类号 G10L15/06
代理机构 代理人 洪澄文 台北市大安区信义路四段二七九号三楼;颜锦顺 台北市大安区信义路四段二七九号三楼
主权项 1.一种利用双音模型实现混合多国语言之语音辨识装置,其用以辨识一混合多语之语音信号为一语音指令,包括:一语音建模器,用以接收上述混合多语之语音信号,将上述混合多语之语音信号转换为复数语音特征参数,再将上述语音特征参数转换为复数语音模型资料;一语音搜寻器,其耦接于上述语音建模器,用以接收上述语音模型资料,并且搜寻比对分别对应于上述语音模型资料之复数候选资料组,每一候选资料组具有复数候选语音模型资料,及其对应之比较相似度,并评估出最佳的复数候选语音指令;以及一决策反应器,其耦接于上述语音搜寻器,由上述候选语音指令中决定对应于上述语音模型资料之复数结果语音模型资料,并将上述结果语音模型资料结合成一语音指令。2.如申请专利范围第1项所述之利用双音模型实现混合多国语言之语音辨识装置,其中上述语音模型资料系为具有双音模型之资料。3.如申请专利范围第1项所述之利用双音模型实现混合多国语言之语音辨识装置,其中上述语音搜寻器,系根据一多语模型资料库进行搜寻比对。4.如申请专利范围第3项所述之利用双音模型实现混合多国语言之语音辨识装置,其中上述多语模型资料库包括复数混合多语字音对应资料。5.如申请专利范围第4项所述之利用双音模型实现混合多国语言之语音辨识装置,其中更包括一多语建模器,用以产生上述混合多语字音对应资料,其包括:一多语音标序列对应器,将复数第一多语查询指令经过比对,得到对应之复数多语音标序列;以及一跨语言双音模型产生器,其耦接于上述多语音标序列对应器,用以筛选组合上述多语音标序列,以得到上述混合多语字音对应资料。6.如申请专利范围第3项所述之利用双音模型实现混合多国语言之语音辨识装置,其中上述多语模型资料库包括复数混合多语矫正模型。7.如申请专利范围第6项所述之利用双音模型实现混合多国语言之语音辨识装置,其中更包括一多语矫正模型产生器,用以产生上述混合多语矫正模型,其包括:至少一单一语言矫正模型产生器,用以接收复数第二多语查询指令,分别对应于复数既定语种进行正规化计算,产生复数单一语言矫正模型;以及一矫正模型结合器,其耦接于上述单一语言矫正模型产生器,用以接收上述单一语言矫正模型,进行加权计算得到上述混合多语矫正模型。8.如申请专利范围第1项所述之利用双音模型实现混合多国语言之语音辨识装置,其中上述语音搜寻器,系根据上述语音模型资料连接的顺序以及一语音规则资料库进行评估。9.一种利用双音模型实现混合多国语言之语音辨识方法,其用以辨识一混合多国语言之语音信号,包括下列步骤:将上述混合多国语言之语音信号转换为复数语音特征参数,再将上述语音特征参数转换为复数语音模型资料;搜寻比对分别对应于上述语音模型资料之复数候选资料组,每一候选资料组具有复数候选语音模型资料,及其对应之比较相似度,并评估出最佳的复数候选语音指令;以及根据上述比较相似度,分别由上述候选资料组中决定对应于上述语音模型资料之复数结果语音模型资料,并将上述结果语音模型资料结合成一语音指令。10.如申请专利范围第9项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述语音模型资料系为具有双音模型之资料。11.如申请专利范围第9项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述双音模型搜寻比对之步骤中,上述搜寻比对系根据一多语模型资料库。12.如申请专利范围第11项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述多语模型资料库包括复数混合多语字音对应资料。13.如申请专利范围第12项所述之利用双音模型实现混合多国语言之语音辨识方法,其中更包括一多语建模程序,用以产生上述混合多语字音对应资料,包括下列步骤:将复数第一多语查询指令经过比对,得到对应之复数多语音标序列;以及筛选组合上述多语音标序列,以得到上述混合多语字音对应资料。14.如申请专利范围第13项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述筛选组合上述已分类之多语音标序列之步骤中,尚包括下列步骤:先固定左侧音标,于右侧音标寻求对应结果;当无法对应时固定右侧音标,于左侧音标寻求对应结果;以及由对应结果得到上述混合多语字音对应资料。15.如申请专利范围第11项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述多语模型资料库包括复数混合多语矫正模型。16.如申请专利范围第15项所述之利用双音模型实现混合多国语言之语音辨识方法,其中更包括一多语矫正模型产生程序,用以产生上述混合多语矫正模型,包括下列步骤:接收复数第二多语查询指令,分别对应于复数既定语种进行正规化计算,产生复数单一语言矫正模型;以及将上述单一语言矫正模型进行加权计算,以得到上述混合多语矫正模型。17.如申请专利范围第9项所述之利用双音模型实现混合多国语言之语音辨识方法,其中上述评估出最佳的上述候选语音指令之步骤系根据上述语音模型资料连接的顺序以及一语音规则资料库进行评估。图式简单说明:第1图系显示本发明之功能方块图。第2图系显示本发明中建置混合多语字音对应资料之功能方块图。第3图系显示本发明中建置混合多语矫正模型之功能方块图。第4图系显示本发明中建置混合多语矫正模型之细部功能方块图。第5图系显示本发明所揭示之实施例中跨语言资料表之范例表示图。第6图系显示本发明所揭示之实施例应用之功能示意图。第7图系显示本发明之执行流程图。
地址 桃园县龟山乡兴邦路三十一之一号