构建语言模型的方法及装置,申请号CN201310207237.2-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	构建语言模型的方法及装置
摘要	本发明公开了一种构建语言模型的方法及装置，属于语音识别技术领域。方法包括：根据对数据样本中的句子进行分类挖掘获取的分类训练样本构建文本分类器；通过文本分类器对数据样本进行分类并获取分类词表和分类语料；根据分类词表从分类语料中得到高频语言模板；分别对高频语言模板、分类语料和分类词表进行训练，得到分类模板语言模型、分类语言模型和分类词表语言模型。本发明通过对从数据样本中挖掘出的分类词表、分类语料和高频语言模板进行训练得到的分类词表语言模型、分类语言模型和分类模板语言模型，实现了在不增加数据样本数量的前提下，增加了语言模型的数量，进而提高了利用上述模型进行语音识别的准确性。
申请公布号	CN104217717B	申请公布日期	2016.11.23
申请号	CN201310207237.2	申请日期	2013.05.29
申请人	腾讯科技（深圳）有限公司	发明人	饶丰;卢鲤;陈波;张翔;岳帅;李露
分类号	G10L15/06(2013.01)I;G10L15/08(2006.01)I	主分类号	G10L15/06(2013.01)I
代理机构	北京三高永信知识产权代理有限责任公司 11138	代理人	滕一斌
主权项	一种构建语言模型的方法，其特征在于，所述方法包括：获取数据样本，并对所述数据样本中的句子进行分类挖掘，将挖掘得到的句子作为数据挖掘的结果；根据所述数据挖掘的结果获取分类训练样本，并根据所述分类训练样本构建文本分类器；通过所述文本分类器对所述数据样本进行分类，根据分类结果获取分类词表和分类语料；根据所述分类词表对所述分类语料进行挖掘，得到高频语言模板；对所述高频语言模板进行训练，得到分类模板语言模型，并对所述分类语料进行训练，得到分类语言模型，对所述分类词表进行训练，得到分类词表语言模型。
地址	518000 广东省深圳市福田区振兴路赛格科技园2栋东403室

您可能感兴趣的专利

Machine and method for packing articles

Bag sealing machines

Tractor mounted ditchers

Colored mortar display

Knitted textile products and methods for their preparation

Latch hinge for play yard

Spectacle frame

Proportioning pump

Feed system for automatic end point apparatus

Cartridge-type turbine starter

Textile drawing mechanism

Surface active polyoxyalkylene compounds having a plurality of heteric polyoxypropylene-polyoxyethylene chains

Manufacture of nu, nu-disubstituted amides of aryl acetic acids

Finishing of solid diphenolic polycarbonates

Deterioration retarders for rubber and compositions comprising the same

Process for improving the color of resins produced from acrolein and pentaerythritol

Biosynthesis of alpha-ketoglutaric acid

Making l-glutamic acid alone or a mixture of l-glutamic acid and alpha-ketoglutaric acid

Shaped articles of propylene polymers having modified surface characteristics and method of making the same