发明名称 |
一种语言模型的训练方法及装置、设备 |
摘要 |
本发明提供一种语言模型的训练方法及装置、设备,所述方法包括:采用离线训练方式获取通用语言模型,并对该通用语言模型进行裁剪,获得裁剪后的语言模型;采用在线训练方式获取预设时间段内日志的日志语言模型;将所述裁剪后的语言模型和所述日志语言模型进行融合,获得用于进行第一遍解码的第一融合语言模型;将所述通用语言模型和所述日志语言模型进行融合,获得用于进行第二遍解码的第二融合语言模型。上述方法解决现有技术离线获取的语言模型对新的语料覆盖不好,导致语言识别率降低的问题。 |
申请公布号 |
CN105654945A |
申请公布日期 |
2016.06.08 |
申请号 |
CN201510719243.5 |
申请日期 |
2015.10.29 |
申请人 |
乐视致新电子科技(天津)有限公司 |
发明人 |
闫志勇 |
分类号 |
G10L15/183(2013.01)I;G10L15/06(2013.01)I |
主分类号 |
G10L15/183(2013.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
李相雨 |
主权项 |
一种语言模型的训练方法,其特征在于,包括:采用离线训练方式获取通用语言模型,并对该通用语言模型进行裁剪,获得裁剪后的语言模型;采用在线训练方式获取预设时间段内日志的日志语言模型;将所述裁剪后的语言模型和所述日志语言模型进行融合,获得用于进行第一遍解码的第一融合语言模型;将所述通用语言模型和所述日志语言模型进行融合,获得用于进行第二遍解码的第二融合语言模型。 |
地址 |
300467 天津市滨海新区天津生态城动漫中路126号动漫大厦B1区二层201-427 |