发明名称 一种语言模型的训练方法及系统
摘要 本发明实施例提供了一种语言模型的训练方法及系统,其中的方法具体包括:获取各领域的种子语料;依据各领域的种子语料的向量空间模型对大数据语料进行筛选,得到相应领域的种子筛选语料;分别利用各领域的种子筛选语料训练得到相应领域的筛选模型;对所有领域的筛选模型进行融合,得到相应的筛选融合模型。本发明实施例能够在减小运算量和省时的前提下,提高语言模型参数的合理性。
申请公布号 CN104572631A 申请公布日期 2015.04.29
申请号 CN201410727566.4 申请日期 2014.12.03
申请人 北京捷通华声语音技术有限公司 发明人 郑晓明;李健;张连毅;武卫东
分类号 G06F17/28(2006.01)I;G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/28(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 刘祥景
主权项 一种语言模型的训练方法,其特征在于,包括:获取各领域的种子语料;依据各领域的种子语料的向量空间模型对大数据语料进行筛选,得到相应领域的种子筛选语料;分别利用各领域的种子筛选语料训练得到相应领域的筛选模型;对所有领域的筛选模型进行融合,得到相应的筛选融合模型。
地址 100193 北京市海淀区东北旺西路8号中关村软件园10号楼二层206-1