发明名称 使用神经网路之声音认识装置及其学方法
摘要 本发明系有关于一种使用神经网路之声音认识装置,本发明之类神经细胞单元具备有:用于记忆内部状态值之内部状态值记忆手段、根据其他类神经细胞之输出、本身之输出、本身外部之输入等而更新内部状态值之内部状态值更新手段以及将内部状态值转换成外部输入之输出值产生手段。由于类神经细胞单元本身可保持所输入之资料之过去的履历,而不必在神经网路设置特别的构造即能处理声音等之时间系列资料。
申请公布号 TW279214 申请公布日期 1996.06.21
申请号 TW082102509 申请日期 1993.04.02
申请人 精工爱普生股份有限公司 发明人 稻积满
分类号 G06F13/38;G06F15/74;G10L7/08 主分类号 G06F13/38
代理机构 代理人 林敏生 台北巿南京东路二段一二五号七楼伟成第一大楼
主权项 1. 一种使用神经网路之声音认识装置,其主要特征 系构 成上述神经网路之各类神经细胞单元具备有:内部 状态値 记忆机构、根据被记忆在上述内部状态値记忆机 构之内部 状态値与被输入到其类神经细胞单元之输入値而 更新内部 状态値之内部状态値更新机构以及将上述内部状 态値记忆 机构之输出转换成外部输出値之输出値生成机构 。2. 如申请专利范围第1项之使用神经网路之声音 认识装置 ,上述内部状态値更新手段系由可对上述输入値以 及上述 内部状态値加权累计之加权累计手段所构成,而上 述内部 状态値记忆手段系由将由上述加权累计手段所累 计的値实 施积分之积分手段所构成,而上述输出値产生手段 系由将 由上述积分手段所得到的値转换成位于事先被设 定之上限 値与下限値之间之値的输出値限制手段所构成。3 . 如申请专利范围第2项之使用神经网路之声音认 识装置 ,当将构成上述神经网路之第号之上述类神经细 胞单元 之内部状态値设为Xi,将i设为时间常数,将对上 述类 神经细胞单元之上述加权输入値设为Zj时(j为0至n, n为 0或自然数),则上述内部状态値更新手段特征为可 将内 部状态値更新为能够满足 的値。4. 如申请专利范围第3项之使用神经网路之 声音认识装置 ,对上述第个类神经细胞单元之加权输入値Zj包 括一在 上述第个类神经细胞单元本身之输出乘上加权 系数的値 。5. 如申请专利范围第1项至第4项之任一项之使 用神经网 路之声音认识装置,对上述第个类神经细胞单元 之加权 输入値Zi包含-在构成上述神经网路之其他类神经 细胞单 元之输出乘上加权系数的値。6. 如申请专利范围 第5项之使用神经网路之声音认识装置 ,对上述第个之类神经细胞单元之加权输入値Zj 包括自 上述神经网路之外部被供给的资料。7. 如申请专 利范围第1项至第4项之任一项之使用神经网 路之声音认识装置,对上述第个之类神经细胞单 元之加 权输入値Zj包括-在某被固定之値乘上加权系数的 値。8. 如申请专利范围第1项至第4项之任一项之 使用神经网 路之声音认识装置,上述输出値产生手段乃备有正 负对称 输出范围。9. 如申请专利范围第1项至第4项之任 一项之使用神经网 路之声音认识装置,上述神经网路至少具有肯定输 出、否 定输出等2种输出。10. 如申请专利范围第1项至第4 项之任一项之使用神经网 路之声音认识装置,上述声音认识装置备有:除了 会抽出 所要认识之输入资料的特征外,亦将抽出特征的値 输入到 上述神经网路之声音特征抽出手段、将上述神经 网路之输 出値转换成认识结果之认识结果输出手段以及将 预先被设 定之初始値供给到构成上述神经网路之类神经细 胞单元之 内部状态値记亿手段的内部状态値初始化手段。 11. 一种使用神经网路之声音认识装置,其主要特 征是在 申请专利范围第10项之声音认识装置中设置包括: 将背景 杂音输入到上述神经网路之背景杂音输入手段以 及除了自 上述神经网路之输出检出平衡状态外,根据检出上 述平衡 状态而输出用于变更事先被设在内部状态初始値 设定手段 之内部状态初始値之信号的平衡状态检出手段。 12. 一种使用神经网路之声音认识装置之学习方法 ,其特 征在于在申请专利范围第11项之声音认识装置中, 上述声 音认识装置具有令上述神经网路学习之学习部,而 上述学 习部备有:用于记忆学习用输入资料的输入资料记 忆手段 、自上述输入资料记忆手段选择学习用输入资料 之输入资 料选择手段、用于记忆学习用输出资料之输出资 料记忆手 段、藉被选择之输入资料与其连锁关系而选择学 习用输出 资料之输出资料选择手段以及除了被选择之学习 用输入资 料输入到上述特征抽出部外,亦控制上述神经网路 之学习 的学习控制手段,而上述学习控制手段可根据上述 神经网 路之输出与上述输出资料选择手段之输出而改变 上述类神 经细胞单元之结合的加权系数。13. 一种使用神经 网路之声音认识装置之学习方法,其特 征在于:上述输入资料记忆手段具有多个范畴,而 上述输 出资料记忆手段具有与上述输入资料记忆手段之 各范畴呈 对应的范畴,上述输入资料选择手段则自上述输入 资料记 忆手段之范畴选择所要学习之多个资料,而上述输 出资料 选择手段则选择可与由上述输入资料选择手段所 选择之学 习用输入资料呈对应的学习用输出资料,上述学习 控制部 备有可将由上述输入资料选择手段所选择之多个 资料连结 成1个的输入资料连结手段以及将由上述输出资料 选择手 段所选择之多个资料连结成1个的输出资料连结手 段,而 上述学习部除了会将上述连结而成之1个学习用输 入资料 输入到声音特征抽出手段外,亦根据上述神经网路 之输出 与上述输出连结手段之输出而改变上述类神经细 胞单元之 结合的加权系数。14. 如申请专利范围第13项之使 用神经网路之声音认识装 置之学习方法,上述范畴的数目为2个。15. 一种使 用神经网路之声音认识装置之学习方法,其特 征在于在申请专利范围第12项至第14项之使用神经 网路之 声音认识装置之学习方法中,上述学习部备有:用 于记忆 杂音资料之杂音资料记忆手段以及将自上述杂音 资料记忆 手段被选择之杂音与上述被选择之学习资料重叠 之杂音重 叠手段,而使用由上述杂音重叠手段而重叠有杂音 之输入 资料令上述神经网路学习。16. 如申请专利范围第 15项之使用神经网路之声音认识装 置之学习方法,令上述背景杂音重叠之位置偏移而 反复地 令其学习。17. 一种使用神经网路之声音认识装置 之学习方法,其特 征在于:在申请专利范围第15项之神经网路之学习 方法中 ,首先藉未重叠有背景杂音之输入资料而学习后, 再令背 景杂音重叠在相同之输入资料而学习。图示简单 说明: 图1系表本发明之构成神经网路之类神经细胞单元 。 图2系表将图1之类神经细胞单元置换成具体的功 能的图形 。 图3系表将图2之构成置换成电气电路的实施例。 图4系表使用由本发明之类神经细胞单元而构成之 神经网 路的声音认识装置的图形。 图5系表将图4之神经网路予以3层化的图形。 图6系表图5之神经网路更加多层化的图形。 图7系表分割图6之转移网路的图形。 图8系表具有自回归环路之神经网路的图形。 图9系表随机结合之神经网路的图形。 图10系表说明本发明之声音认识装置之相对杂音 性的图形 。 图11系表用于说明本发明之声音认识装置之时间 刻度之学 习项效果的图形。 图12系表使用本发明之类神经细胞单元之其他声 音认识装 置的构成图。 图13系表图12之声音认识装置之动作顺序图。 图14系表使用本发明之神经网路之声音认识装置 之学习方 法的图形。 图15系表本发明之学习方法之学习顺序的图形。 图16系表本发明之学习资料之连结状态的图形。 图17系表本发明之学习资料之构成的图形。 图18系表使用本发明之神经网路之声音认识装置 之学习方 法之另一实施例。 图19系表根据本发明之声音认识装置而来之声音 单语检出 输出的图形。 图20系表根据本发明之声音认识装置而来之另一 声音单语 检出输出的图形。 图21系表本发明之声音认识装置之另一构成图。 图22系表图21之声音认识装置之动作顺序图。 图23系表具有背景杂音重叠手段之声音认识装置 之学习方 法的图形。 图24系表将杂音资料重叠至学习资料之方法的图 形。 图25系表在藉本发明之学习方法而学习之神经网 路中给予 未知单语之识别结果的图形。 图26系将图25之同样处理对未知话者实施时之识别 结果的 图形。 图27系表在与图26同样的处理中给予背景杂音时之 识别结 果的图形。 图28系表习知技术之类神经细胞单元的图形。 图29系表将图28之类神经细胞单元置换成具体机能 的图形 。
地址 日本