用于语音识别的声学模型训练方法及装置,申请号CN201610195612.X-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	用于语音识别的声学模型训练方法及装置
摘要	本发明实施例提供一种用于语音识别的声学模型训练方法及装置，所述方法包括：获取训练样本；所述训练样本包括声学特征以及所述声学特征对应的训练文本；获取原始声学模型，并利用所述原始声学模型，确定每一训练文本对应的所述原始声学模型中的声学状态；根据每一训练文本对应的声学状态以及声学特征，确定每一声学状态对应的声学特征；利用每一声学状态对应的声学特征，重新训练获得所述声学状态的状态描述模型；利用重新训练获得的状态描述模型，更新所述原始声学模型中的原始状态描述模型，获得更新之后的声学模型，本发明实施例降低了模型训练复杂度，且通过对原始声学模型进行更新，未破坏原始声学模型的结构，也保证了语音识别的准确度。
申请公布号	CN105845130A	申请公布日期	2016.08.10
申请号	CN201610195612.X	申请日期	2016.03.30
申请人	乐视控股（北京）有限公司;乐视致新电子科技（天津）有限公司	发明人	张俊博
分类号	G10L15/06(2013.01)I	主分类号	G10L15/06(2013.01)I
代理机构	北京国昊天诚知识产权代理有限公司 11315	代理人	刘戈
主权项	一种用于语音识别的声学模型训练方法，其特征在于，包括：获取训练样本；所述训练样本包括声学特征以及所述声学特征对应的训练文本；获取原始声学模型，并利用所述原始声学模型，确定每一训练文本对应的所述原始声学模型中的声学状态；根据每一训练文本对应的声学状态以及声学特征，确定每一声学状态对应的声学特征；利用每一声学状态对应的声学特征，重新训练获得所述声学状态的状态描述模型；利用重新训练获得的状态描述模型，更新所述原始声学模型中的原始状态描述模型，获得更新之后的声学模型。
地址	100025 北京市朝阳区姚家园105号3号楼10层1102

您可能感兴趣的专利

INFORMATION PROCESSING DEVICE, INFORMATION-DISPLAYING PROGRAM THEREFOR, AND INFORMATION DISPLAYING METHOD

LENS ARRAY IMAGING WITH CROSS-TALK INHIBITING OPTICAL STOP STRUCTURE

VISUAL DISPLAY DEVICE

PUMP CONTROL DEVICE OF CONSTRUCTION MACHINE

MEDICAL BAG RACK

METHOD FOR PRODUCING CLONED DOG

CONNECTING DEVICE OF LURE FOR FISHING CUTTLEFISH

METHOD FOR CULTURING CELL AND SUBSTRATE FOR CELL CULTURE

STRAINER ELEMENT CLEANING TOOL

CATALYTIC MIXTURE FOR MANUFACTURING EPOXY COMPOUND AND MANUFACTURING METHOD OF EPOXY COMPOUND USING THIS CATALYTIC MIXTURE

ELECTRIC ACTUATOR FOR PARKING LOCK DEVICE

WASTE TREATMENT APPARATUS AND METHOD

OUTPUT SOUND SETTING SYSTEM FOR INFORMATION PROCESSING TERMINAL

X-Y ADDRESS TYPE SOLID STATE IMAGING ELEMENT

CODING DEVICE, AND PROGRAM

SYSTEM PREVENTING DETERIORATION IN DATA RETENTION PROPERTY

NAVIGATION DEVICE, NAVIGATION METHOD, INFORMATION DELIVERY SYSTEM, AND INFORMATION DELIVERY METHOD

CATALOG PREPARATION SYSTEM, PARTS CATALOG PREPARATION METHOD, PROGRAM, AND RECORDING MEDIUM

TUNNEL ILLUMINATION CONTROL SYSTEM WITH SPEECH COMMUNICATION FUNCTION