发明名称 一种神经网络声学模型训练方法
摘要 本发明涉及一种神经网络声学模型训练方法,所述方法具体包含:步骤101)搭建基础DNN网络架构,所述DNN网络架构包含:输入层,隐含层和输出层,其中输出层用于输出三音素状态集;步骤102)对输出的三音素状态集聚类,并将聚类后的三音素根据中心音素进行分类,分为中文音素、英文音素及非语音音素三类;步骤103)在输出层增加一组线索结点,该组线索结点分别对应步骤102)对三音素分类得到的三类结果;其中,加入的线索结点与最后一层隐含层全连接,得到最终网络架构;步骤104)针对得到的最终网络架构进行训练,当训练完成后将线索结点从网络中剥离,进而完成针对神经网络声学模型训练,再基于剥离后的网络进行语音识别。
申请公布号 CN106297773A 申请公布日期 2017.01.04
申请号 CN201510290592.X 申请日期 2015.05.29
申请人 中国科学院声学研究所;北京中科信利技术有限公司 发明人 张晴晴;陈梦喆;潘接林;颜永红
分类号 G10L15/06(2013.01)I 主分类号 G10L15/06(2013.01)I
代理机构 北京方安思达知识产权代理有限公司 11472 代理人 王宇杨;王蔚
主权项 一种神经网络声学模型训练方法,所述方法为:在神经网络输出层增加一组线索结点,基于增加线索节点后的网络对神经网络声学模型进行训练。
地址 100190 北京市海淀区北四环西路21号