发明名称 | 一种神经网络声学模型训练方法 | ||
摘要 | 本发明涉及一种神经网络声学模型训练方法,所述方法具体包含:步骤101)搭建基础DNN网络架构,所述DNN网络架构包含:输入层,隐含层和输出层,其中输出层用于输出三音素状态集;步骤102)对输出的三音素状态集聚类,并将聚类后的三音素根据中心音素进行分类,分为中文音素、英文音素及非语音音素三类;步骤103)在输出层增加一组线索结点,该组线索结点分别对应步骤102)对三音素分类得到的三类结果;其中,加入的线索结点与最后一层隐含层全连接,得到最终网络架构;步骤104)针对得到的最终网络架构进行训练,当训练完成后将线索结点从网络中剥离,进而完成针对神经网络声学模型训练,再基于剥离后的网络进行语音识别。 | ||
申请公布号 | CN106297773A | 申请公布日期 | 2017.01.04 |
申请号 | CN201510290592.X | 申请日期 | 2015.05.29 |
申请人 | 中国科学院声学研究所;北京中科信利技术有限公司 | 发明人 | 张晴晴;陈梦喆;潘接林;颜永红 |
分类号 | G10L15/06(2013.01)I | 主分类号 | G10L15/06(2013.01)I |
代理机构 | 北京方安思达知识产权代理有限公司 11472 | 代理人 | 王宇杨;王蔚 |
主权项 | 一种神经网络声学模型训练方法,所述方法为:在神经网络输出层增加一组线索结点,基于增加线索节点后的网络对神经网络声学模型进行训练。 | ||
地址 | 100190 北京市海淀区北四环西路21号 |