发明名称 | 用于计算机辅助控制和/或调节燃气涡轮机的方法 | ||
摘要 | 本发明涉及一种用于计算机辅助控制和/或调节技术系统的方法。在该方法中采用了增强学方法和人工神经网络。在此在优选的实施形式中并行的前馈网络如此相互逻辑连接,使得架构整体上满足最优性判据。网络在此把所观测的报酬近似作为对所预期的报酬的估计量。这样以最佳的方式和方法来仅仅使用实际上进行的观测来确定品质函数。从网络固有地所获得的品质函数于是提供针对所给定的控制问题的最佳动作选择规则。本发明可以在任意技术系统中被用于调节或控制,优选的应用领域是涡轮机、尤其是燃气涡轮机的调节或控制。 | ||
申请公布号 | CN101689044B | 申请公布日期 | 2012.03.21 |
申请号 | CN200880020134.2 | 申请日期 | 2008.04.04 |
申请人 | 西门子公司 | 发明人 | D·施尼加斯;S·尤德卢夫特 |
分类号 | G05B13/02(2006.01)I | 主分类号 | G05B13/02(2006.01)I |
代理机构 | 中国专利代理(香港)有限公司 72001 | 代理人 | 卢江;李家麟 |
主权项 | 用于计算机辅助控制和/或调节燃气涡轮机的方法,其中:a)燃气涡轮机的动态特性对于多个时间点(t)分别通过燃气涡轮机的状态(st,xt)以及在燃气涡轮机上所执行的动作(at)来表征,其中在相应时间点(t)的相应动作(at)引向燃气涡轮机在下一时间点(t+1)的后续状态(st+1,xt+1);b)学习具有多个数据组的动作选择规则,其中每个数据组都包括燃气涡轮机在相应时间点(t)的状态(st,xt)、在状态(st,xt)所执行的动作(at)以及后续状态(st+1,xt+1),并且给每个数据组分配评估(ri),其中动作选择规则的学习包括以下步骤:i)通过包括燃气涡轮机的状态(st,xt)和动作(at)作为参数的一个或多个神经网络(Na(s))来建模品质函数(Q(s,a));ii)根据最优性判据来学习所述一个或多个神经网络(Na(s)),其中所述最优性判据依赖于数据组的评估(ri)以及品质函数(Q(s,a));c)燃气涡轮机通过以下方式被调节和/或控制,即利用所学习的动作选择规则根据所学习的所述一个或多个神经网络(Na(s))来选择在燃气涡轮机上要执行的动作(at)。 | ||
地址 | 德国慕尼黑 |