发明名称 一种语言模型的训练方法及装置、设备
摘要 本发明提供一种语言模型的训练方法及装置、设备,所述方法包括:采用离线训练方式获取通用语言模型,并对该通用语言模型进行裁剪,获得裁剪后的语言模型;采用在线训练方式获取预设时间段内日志的日志语言模型;将所述裁剪后的语言模型和所述日志语言模型进行融合,获得用于进行第一遍解码的第一融合语言模型;将所述通用语言模型和所述日志语言模型进行融合,获得用于进行第二遍解码的第二融合语言模型。上述方法解决现有技术离线获取的语言模型对新的语料覆盖不好,导致语言识别率降低的问题。
申请公布号 CN105654945A 申请公布日期 2016.06.08
申请号 CN201510719243.5 申请日期 2015.10.29
申请人 乐视致新电子科技(天津)有限公司 发明人 闫志勇
分类号 G10L15/183(2013.01)I;G10L15/06(2013.01)I 主分类号 G10L15/183(2013.01)I
代理机构 北京路浩知识产权代理有限公司 11002 代理人 李相雨
主权项 一种语言模型的训练方法,其特征在于,包括:采用离线训练方式获取通用语言模型,并对该通用语言模型进行裁剪,获得裁剪后的语言模型;采用在线训练方式获取预设时间段内日志的日志语言模型;将所述裁剪后的语言模型和所述日志语言模型进行融合,获得用于进行第一遍解码的第一融合语言模型;将所述通用语言模型和所述日志语言模型进行融合,获得用于进行第二遍解码的第二融合语言模型。
地址 300467 天津市滨海新区天津生态城动漫中路126号动漫大厦B1区二层201-427