发明名称 |
一种语言模型的训练方法及系统 |
摘要 |
本发明实施例提供了一种语言模型的训练方法及系统,其中的方法具体包括:获取各领域的种子语料;依据各领域的种子语料的向量空间模型对大数据语料进行筛选,得到相应领域的种子筛选语料;分别利用各领域的种子筛选语料训练得到相应领域的筛选模型;对所有领域的筛选模型进行融合,得到相应的筛选融合模型。本发明实施例能够在减小运算量和省时的前提下,提高语言模型参数的合理性。 |
申请公布号 |
CN104572631A |
申请公布日期 |
2015.04.29 |
申请号 |
CN201410727566.4 |
申请日期 |
2014.12.03 |
申请人 |
北京捷通华声语音技术有限公司 |
发明人 |
郑晓明;李健;张连毅;武卫东 |
分类号 |
G06F17/28(2006.01)I;G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
刘祥景 |
主权项 |
一种语言模型的训练方法,其特征在于,包括:获取各领域的种子语料;依据各领域的种子语料的向量空间模型对大数据语料进行筛选,得到相应领域的种子筛选语料;分别利用各领域的种子筛选语料训练得到相应领域的筛选模型;对所有领域的筛选模型进行融合,得到相应的筛选融合模型。 |
地址 |
100193 北京市海淀区东北旺西路8号中关村软件园10号楼二层206-1 |